Monday,September 5

よみがな自動処理への道【4】ローカルとサーバのダブルシステム (01 photos)

さて、ようやくMeCabがコマンドで動くようになりました。
これで他のプログラムからシステムコマンドでMeCabを呼びだせます。

でも、その前に。
WindowsOSにMeCabをインストールした理由を説明せねばなりません。

スタジオムーンリーフではウェブサーバにデータをアップする前に、ローカルPCでの動作確認を必須としています。
サーバにアップする前に、ローカルPCで見た目や誤字・脱字をチェックするのが主な目的ですが、ローカルPCとサーバにほぼ同一のシステムとデータを持つことで相互をバックアップとして扱うことができます。いずれか一方のシステムがクラッシュしたとしても残った片方をバックアップにしてすみやかに復旧できるというリスク管理ができるというわけです。

ブログにしてもそのブログデータを、いちどローカルPCに対してアップデートして動作確認と表示を確認してからウェブサーバにデータをアップするという流れになっています。

よってよみがなデータを作るためにMeCabをインストールするのはローカルPC、WindowsOSということになるわけです。

さらに。
スタジオムーンリーフがウェブ関連プログラムでウェブを制作するようになったのは10年ほど昔。

そのころにはCMSなんて便利な技術もなく、当然WordPressといったお手軽な(?)CMSサービスもありませんでした。
そして、いまは流行りのPHPも当時はあまり頼りないウェブ言語であったため、主流ではなかったんです。

当時ウェブプログラムで主流だったのは、いまでは名前を聞くこともほとんどなく入門書すら書店で見かけることもなくなったPerl(パール)です。
Perlはたいへんよくできた言語であり、文字列の扱いにも強い関数やモジュールも多かったことからウェブ開発にうってつけでした。
Perlはだいたいのことが可能となっており、言語としてはほぼ完成型だったんですよ。
スタジオムーンリーフでは現在でもPerlでウェブ開発をしています。

「PerlよりPHPやrubyの方が処理が早い」なんて話も耳にしますが、よほどの重い処理でもしない限り目に見える差は生じませんし、処理時間を短縮する方法だっていくつかあります。

ウェブプログラムで処理を重くするのは、アクセスの集中によるデータベースやファイルとのアクセス回数が多くなることと、ループ処理の多さによるものだと言っても過言ではないでしょう。
つまり、データベースとファイルへのアクセス回数やループ処理を1回でも減らすようにコードを工夫できれば、それが処理時間の短縮につながるわけです。

スタジオムーンリーフがローカルPCとウェブサーバーとのダブルシステムを使っているのには、そんな理由もありまして。
ローカルPCはデータベースを更新することに特化し、ウェブサーバーはデータベースを読みこむことに特化してシステムの使い道をわけています。
これによりローカルPCでデータベースを更新する処理はどんなに重くなっても処理時間や効率に縛られずにコードを書くことができるというわけです。
サーバではデータベースを読みこむ回数を極力減らし、処理することに特化しており表示にかかる時間を短くするよう腐心しています。

以上により、MeCabと連携するプログラムはPerlでご紹介することになります。
いくつかPerlのコードも紹介するかもしれませんが、マイナー言語となってしまったPerlのことですから「わかんねえよ」という人が大半かと思います。できるだけ解説もまじえながらログを進めていきたいと思います。

よみがな自動処理への道【4】ローカルとサーバのダブルシステム_sb_01.png

コマンドプロンプトで「Perl -v」と入力するとPerlのバージョンを確認できます。



≫ NEXT_LOG よみがな自動処理への道【5】PerlとMeCabはパイプでつながる

≪ PREV_LOG よみがな自動処理への道【3】Shift-JIS→UTF8へ(06 photos)

PAGE UP

Google+

スタジオムーンリーフ(2005年1月開設/Since 2005)
代表者:野口 卓洋(Takuhiro Noguchi)
Add:356-0006 埼玉県ふじみ野市霞ヶ丘3-1-22-504

Twitter:@StudioMoonLeaf
Facebook:facebook.com/noguchi.takuhiro


©2017 STUDIO MOON LEAF ALL RIGHTS RESERVED.