Sunday,September 11

よみがな自動(じどう)処理(しょり)への(みち)最終(さいしゅう)(かい)】まとめ

以上(いじょう)、8ログにわたってご紹介(しょうかい)した「よみがな自動(じどう)処理(しょり)への(みち)最終(さいしゅう)(かい)はこれまでのまとめです。
開発(かいはつ)(なが)れがわかるようにこれまでのログを()りかえって(まい)ります。

「よみがな自動(じどう)処理(しょり)への(みち)

(きゅう)ふりがな処理(しょり)

(はん)自動(じどう)ふりがな処理(しょり)プログラムの仕組(しく)

> 漢字(かんじ)によみがなをうつ【前編(ぜんぺん)

(はん)自動(じどう)ふりがな処理(しょり)プログラムの(あな)「ついたち処理(しょり)

> 漢字(かんじ)によみがなをうつ【後編(こうへん)

(ぜん)自動(じどう)ふりがな処理(しょり)開発(かいはつ)へ>

フリーの形態素(けいたいそ)解析(かいせき)プログラム「Mecab(和布蕪(めかぶ)=めかぶ)」をダウンロード・インストール

> よみがな自動(じどう)処理(しょり)への(みち)【1】その()は「めかぶ」

パスを(とお)してコマンドプロンプトでmecabコマンドを有効(ゆうこう)にする

> よみがな自動(じどう)処理(しょり)への(みち)【2】パスれ!

MeCabによみがな処理(しょり)(よう)出力(しゅつりょく)フォーマットを設定(せってい)
文字(もじ)コードをUTF8に設定(せってい)

> よみがな自動(じどう)処理(しょり)への(みち)【3】Shift-JIS→UTF8へ

開発(かいはつ)環境(かんきょう)はWindows7。
開発(かいはつ)言語(げんご)はいまはマイナー言語(げんご)となってしまったPerlです、あしからず。

> よみがな自動(じどう)処理(しょり)への(みち)【4】ローカルとサーバのダブルシステム

Perlからパイプでコマンドを送信(そうしん)してMeCabの形態素(けいたいそ)解析(かいせき)します。

> よみがな自動(じどう)処理(しょり)への(みち)【5】PerlとMeCabはパイプでつながる

MeCabの()解析(かいせき)全角(ぜんかく)カタカナなので、ひらがなに変換(へんかん)します。

> よみがな自動(じどう)処理(しょり)への(みち)【6】全角(ぜんかく)カタカナ→全角(ぜんかく)ひらがな

いくつもの障害(しょうがい)()りこえてよみがな処理(しょり)開発(かいはつ)します

> よみがな自動(じどう)処理(しょり)への(みち)【7】ヤマにも()ケズ

よみがな処理(しょり)がスムーズに開発(かいはつ)できるよう、MeCabの辞書(じしょ)単語(たんご)登録(とうろく)()調整(ちょうせい)

> よみがな自動(じどう)処理(しょり)への(みち)【8】1(にち)にして()らず


このようにしてよみがな処理(しょり)開発(かいはつ)することができました。

ここまで(なが)いログを()いたのは、自慢(じまん)したい気持(きも)ちもちょびっとありますが((わら))、ほかにも理由(りゆう)がありまして。

インターネットはどんどん身近(みぢか)になっています。
パソコンだけでなくスマートフォンの普及(ふきゅう)もめざましく、いまやインターネットは大人(おとな)だけでなく、小中学生(しょうちゅうがくせい)利用(りよう)する情報(じょうほう)ツールになりつつあります。

しかしながら、そもそもインターネット技術(ぎじゅつ)海外(かいがい)()まれ。
英語(えいご)代表(だいひょう)されるアルファベット言語(げんご)仕様(しよう)中心(ちゅうしん)にあり、世界(せかい)でもマイナー言語(げんご)である日本語(にほんご)特殊(とくしゅ)事情(じじょう)はあまり配慮(はいりょ)されていません。また、その日本語(にほんご)漢字(かんじ)だけでなくひらがなやカタカナが()()じる、世界(せかい)でも難解(なんかい)言語(げんご)です。ウェブ技術(ぎじゅつ)においても、漢字(かんじ)によみがなをうつのはややめんどうくさい仕様(しよう)となっています。

これらの事情(じじょう)により、日本(にっぽん)のほとんどのウェブサイトの日本語(にほんご)漢字(かんじ)にはよみがな(ふりがな)がありません。したがって、日本(にっぽん)でのインターネット利用(りよう)には、どんな(むずか)しい漢字(かんじ)でも()める大人(おとな)と、(むずか)しい漢字(かんじ)()()れていない小中学生(しょうちゅうがくせい)ぐらいの年齢(ねんれい)()どもとのあいだに、年齢(ねんれい)ギャップがあると(かんが)えられます。

このギャップを()めようと、(おも)大手(おおて)ニュースサイトにおいては「こども(よう)」としてやさしい日本語(にほんご)漢字(かんじ)によみがなのある独立(どくりつ)したコンテンツを(つく)ったり、URLを送信(そうしん)するとページにある漢字(かんじ)によみがなをうつウェブサービスがあったり、スマートフォンにもウェブページの漢字(かんじ)によみがなをうつアプリがあったりします。

でも。
大人(おとな)()どもも(おな)じコンテンツを(おな)じように閲覧(えつらん)できるのが情報(じょうほう)()社会(しゃかい)自然(しぜん)姿(すがた)だと(おも)うんです。また、情報(じょうほう)受信(じゅしん)(しゃ)がわざわざURLを送信(そうしん)しないとよみがなのあるページが()られないというは、やはり不便(ふべん)です。

日本(にっぽん)においては、情報(じょうほう)発信(はっしん)する(がわ)積極(せっきょく)(てき)によみがなのあるテキストでコンテンツを提供(ていきょう)して、大人(おとな)()どもの年齢(ねんれい)ギャップのないウェブデザインを標準(ひょうじゅん)(てき)仕様(しよう)にしていくべきだと(おも)うんです。こういうのもバリアフリーあるいはユニバーサルデザイン(てき)(かんが)えと()えると(おも)います。

ひょっとしたら、わたし以外(いがい)にも「(ぜん)自動(じどう)よみがな処理(しょり)導入(どうにゅう)できたらなあ」と(かんが)える(ひと)がいるかもしれません。これまでの(なが)いログには、「よみがな処理(しょり)」を開発(かいはつ)する(とき)にぶち()たるであろういくつもの(かべ)突破(とっぱ)できるヒントが()りばめてあります。

「よみがな処理(しょり)」を導入(どうにゅう)費用(ひよう)ゼロ(えん)構築(こうちく)できた記録(きろく)が、どなたかの(やく)()てば(さいわ)いです。


≫ NEXT_LOG 旭山(あさひやま)動物(どうぶつ)(えん)にて・1(7 photos)

≪ PREV_LOG よみがな自動(じどう)処理(しょり)への(みち)【8】1(にち)にして()らず(3 photos)

PAGE UP

Google+

スタジオムーンリーフ(2005年1月開設/Since 2005)
代表者:野口 卓洋(Takuhiro Noguchi)
Add:356-0006 埼玉県ふじみ野市霞ヶ丘3-1-22-504

Twitter:@StudioMoonLeaf
Facebook:facebook.com/noguchi.takuhiro


©2017 STUDIO MOON LEAF ALL RIGHTS RESERVED.