Sunday,September 11
よみがな自動処理()への道()【最終()回()】まとめ
以上()、8ログにわたってご紹介()した「よみがな自動()処理()への道()」最終()回()はこれまでのまとめです。
開発()の流()れがわかるようにこれまでのログを振()りかえって参()ります。
「よみがな自動()処理()への道()」
<旧()ふりがな処理()>
半()自動()ふりがな処理()プログラムの仕組()み
> 漢字()によみがなをうつ【前編()】
半()自動()ふりがな処理()プログラムの穴()「ついたち処理()」
> 漢字()によみがなをうつ【後編()】
<全()自動()ふりがな処理()開発()へ>
フリーの形態素()解析()プログラム「Mecab(和布蕪()=めかぶ)」をダウンロード・インストール
> よみがな自動()処理()への道()【1】その名()は「めかぶ」
パスを通()してコマンドプロンプトでmecabコマンドを有効()にする
> よみがな自動()処理()への道()【2】パスれ!
MeCabによみがな処理()用()の出力()フォーマットを設定()
文字()コードをUTF8に設定()
> よみがな自動()処理()への道()【3】Shift-JIS→UTF8へ
開発()環境()はWindows7。
開発()言語()はいまはマイナー言語()となってしまったPerlです、あしからず。
> よみがな自動()処理()への道()【4】ローカルとサーバのダブルシステム
Perlからパイプでコマンドを送信()してMeCabの形態素()解析()します。
> よみがな自動()処理()への道()【5】PerlとMeCabはパイプでつながる
MeCabの読()み解析()は全角()カタカナなので、ひらがなに変換()します。
> よみがな自動()処理()への道()【6】全角()カタカナ→全角()ひらがな
いくつもの障害()を乗()りこえてよみがな処理()を開発()します
> よみがな自動()処理()への道()【7】ヤマにも負()ケズ
よみがな処理()がスムーズに開発()できるよう、MeCabの辞書()に単語()登録()・微()調整()
> よみがな自動()処理()への道()【8】1日()にして成()らず
このようにしてよみがな処理()を開発()することができました。
ここまで長()いログを書()いたのは、自慢()したい気持()ちもちょびっとありますが(笑())、ほかにも理由()がありまして。
インターネットはどんどん身近()になっています。
パソコンだけでなくスマートフォンの普及()もめざましく、いまやインターネットは大人()だけでなく、小中学生()も利用()する情報()ツールになりつつあります。
しかしながら、そもそもインターネット技術()は海外()生()まれ。
英語()に代表()されるアルファベット言語()の仕様()が中心()にあり、世界()でもマイナー言語()である日本語()の特殊()事情()はあまり配慮()されていません。また、その日本語()も漢字()だけでなくひらがなやカタカナが入()り混()じる、世界()でも難解()な言語()です。ウェブ技術()においても、漢字()によみがなをうつのはややめんどうくさい仕様()となっています。
これらの事情()により、日本()のほとんどのウェブサイトの日本語()の漢字()にはよみがな(ふりがな)がありません。したがって、日本()でのインターネット利用()には、どんな難()しい漢字()でも読()める大人()と、難()しい漢字()を読()み慣()れていない小中学生()ぐらいの年齢()の子()どもとのあいだに、年齢()ギャップがあると考()えられます。
このギャップを埋()めようと、主()に大手()ニュースサイトにおいては「こども用()」としてやさしい日本語()と漢字()によみがなのある独立()したコンテンツを作()ったり、URLを送信()するとページにある漢字()によみがなをうつウェブサービスがあったり、スマートフォンにもウェブページの漢字()によみがなをうつアプリがあったりします。
でも。
大人()も小()どもも同()じコンテンツを同()じように閲覧()できるのが情報()化()社会()の自然()な姿()だと思()うんです。また、情報()の受信()者()がわざわざURLを送信()しないとよみがなのあるページが見()られないというは、やはり不便()です。
日本()においては、情報()を発信()する側()が積極()的()によみがなのあるテキストでコンテンツを提供()して、大人()と子()どもの年齢()ギャップのないウェブデザインを標準()的()な仕様()にしていくべきだと思()うんです。こういうのもバリアフリーあるいはユニバーサルデザイン的()な考()えと言()えると思()います。
ひょっとしたら、わたし以外()にも「全()自動()よみがな処理()が導入()できたらなあ」と考()える人()がいるかもしれません。これまでの長()いログには、「よみがな処理()」を開発()する時()にぶち当()たるであろういくつもの壁()を突破()できるヒントが散()りばめてあります。
「よみがな処理()」を導入()費用()ゼロ円()で構築()できた記録()が、どなたかの役()に立()てば幸()いです。
≫ NEXT_LOG 旭山()動物()園()にて・1(7 photos)
≪ PREV_LOG よみがな自動()処理()への道()【8】1日()にして成()らず(3 photos)