Sunday,September 11

よみがな自動処理への道【最終回】まとめ

以上、8ログにわたってご紹介した「よみがな自動処理への道」最終回はこれまでのまとめです。
開発の流れがわかるようにこれまでのログを振りかえって参ります。

「よみがな自動処理への道」

<旧ふりがな処理>

半自動ふりがな処理プログラムの仕組み

> 漢字によみがなをうつ【前編】

半自動ふりがな処理プログラムの穴「ついたち処理」

> 漢字によみがなをうつ【後編】

<全自動ふりがな処理開発へ>

フリーの形態素解析プログラム「Mecab(和布蕪=めかぶ)」をダウンロード・インストール

> よみがな自動処理への道【1】その名は「めかぶ」

パスを通してコマンドプロンプトでmecabコマンドを有効にする

> よみがな自動処理への道【2】パスれ!

MeCabによみがな処理用の出力フォーマットを設定
文字コードをUTF8に設定

> よみがな自動処理への道【3】Shift-JIS→UTF8へ

開発環境はWindows7。
開発言語はいまはマイナー言語となってしまったPerlです、あしからず。

> よみがな自動処理への道【4】ローカルとサーバのダブルシステム

Perlからパイプでコマンドを送信してMeCabの形態素解析します。

> よみがな自動処理への道【5】PerlとMeCabはパイプでつながる

MeCabの読み解析は全角カタカナなので、ひらがなに変換します。

> よみがな自動処理への道【6】全角カタカナ→全角ひらがな

いくつもの障害を乗りこえてよみがな処理を開発します

> よみがな自動処理への道【7】ヤマにも負ケズ

よみがな処理がスムーズに開発できるよう、MeCabの辞書に単語登録・微調整

> よみがな自動処理への道【8】1日にして成らず


このようにしてよみがな処理を開発することができました。

ここまで長いログを書いたのは、自慢したい気持ちもちょびっとありますが(笑)、ほかにも理由がありまして。

インターネットはどんどん身近になっています。
パソコンだけでなくスマートフォンの普及もめざましく、いまやインターネットは大人だけでなく、小中学生も利用する情報ツールになりつつあります。

しかしながら、そもそもインターネット技術は海外生まれ。
英語に代表されるアルファベット言語の仕様が中心にあり、世界でもマイナー言語である日本語の特殊事情はあまり配慮されていません。また、その日本語も漢字だけでなくひらがなやカタカナが入り混じる、世界でも難解な言語です。ウェブ技術においても、漢字によみがなをうつのはややめんどうくさい仕様となっています。

これらの事情により、日本のほとんどのウェブサイトの日本語の漢字にはよみがな(ふりがな)がありません。したがって、日本でのインターネット利用には、どんな難しい漢字でも読める大人と、難しい漢字を読み慣れていない小中学生ぐらいの年齢の子どもとのあいだに、年齢ギャップがあると考えられます。

このギャップを埋めようと、主に大手ニュースサイトにおいては「こども用」としてやさしい日本語と漢字によみがなのある独立したコンテンツを作ったり、URLを送信するとページにある漢字によみがなをうつウェブサービスがあったり、スマートフォンにもウェブページの漢字によみがなをうつアプリがあったりします。

でも。
大人も小どもも同じコンテンツを同じように閲覧できるのが情報化社会の自然な姿だと思うんです。また、情報の受信者がわざわざURLを送信しないとよみがなのあるページが見られないというは、やはり不便です。

日本においては、情報を発信する側が積極的によみがなのあるテキストでコンテンツを提供して、大人と子どもの年齢ギャップのないウェブデザインを標準的な仕様にしていくべきだと思うんです。こういうのもバリアフリーあるいはユニバーサルデザイン的な考えと言えると思います。

ひょっとしたら、わたし以外にも「全自動よみがな処理が導入できたらなあ」と考える人がいるかもしれません。これまでの長いログには、「よみがな処理」を開発する時にぶち当たるであろういくつもの壁を突破できるヒントが散りばめてあります。

「よみがな処理」を導入費用ゼロ円で構築できた記録が、どなたかの役に立てば幸いです。


≫ NEXT_LOG 旭山動物園にて・1(7 photos)

≪ PREV_LOG よみがな自動処理への道【8】1日にして成らず(3 photos)

PAGE UP

Google+

スタジオムーンリーフ(2005年1月開設/Since 2005)
代表者:野口 卓洋(Takuhiro Noguchi)
Add:356-0006 埼玉県ふじみ野市霞ヶ丘3-1-22-504

Twitter:@StudioMoonLeaf
Facebook:facebook.com/noguchi.takuhiro


©2017 STUDIO MOON LEAF ALL RIGHTS RESERVED.