カレンダー

2018/01
 
   
       

広告

Twitter

記事検索

ランダムボタン

数年ぶりのメカブ

by 唐草 [2018/10/12]



 「めかぶ」という音を聞いたら100人中98人は、食べ物の「芽かぶ」を想像するだろう。想像できても味や食感を克明に思い浮かべられたり、レシピをスラスラと語れる人はどれぐらいいるのだろう?ぼくは食感もレシピも思い出せない。と言うか食べた記憶すらない。ネバネバ系食品だったようなおぼろげな知識があるだけだ。
 ひょんなことから目の前に「モズク」と「芽かぶ」を置かれて「芽かぶを選べなければ命はない!」と謎の選択を迫れたとしても、悲劇的な結末しか想像できない。ぼくの最後の晩餐はモズクになるのだろう。
 不確かな知識しか無く、微塵の愛着も無いのに芽かぶの話をしているのには訳がある。今日、数年ぶりにメカブに再会したからだ。
 もちろん食べ物の方ではない。ソフトウェアのMeCabである。
 MeCabを使っている人なんて、芽かぶが大好きで1週間に5日は芽かぶを食べている人より少ないかもしれない。マイナーなソフトかもしれないが、ぼくは妙に縁がある。
 MeCabは、オープンソースの形態素解析エンジン。噛み砕いて説明すると「文章を動詞とか助詞とかに分けてくれるソフト」と言った感じ。中学校の国語の時間に習ったもののその学期の期末試験ぐらいでしか使うことのなかった動詞の活用とかを判断してくれる強力なソフトである。
 ぼくは数年前、MeCabで遊んでいた。検索を使ったゲーム『ググレカスの乱』のカードに書かれた言葉は、Yahoo!ニュースのヘッドラインをMeCabで形態素解析して名詞と動詞だけを抜き出していた。また、別のところで公開していた時事川柳を自動で生成する『カオス川柳ジェネレータ』もMeCabを利用していた。ぼくは『カオス川柳ジェネレータ』こそ世界でもっともMeCabを無駄遣いしたコンテンツだと自負している。
 便利で強力なMeCabであったが、ぼくが遊んでいた当時はバイナリで配布されていなかった。サーバを更新するたびにソースコードからビルドする必要があった。維持に手間が掛かるし、ぼくがMeCabに飽きたので先代のサーバを導入したときにインストールをやめていた。
 それから8年以上の月日が経ったはずだ。
 もう二度とMeCabを使うことは無いと思っていた。ところが再開は唐突にやってきた。AIに日本語を理解させるためにMeCabが必要になったのだ。面倒だとか言ってる余裕もなくインストールするしかない事態に巻き込まれたのである。
 以前に使っていた頃、日本語の表記のブレに振り回されてぼくが作りたかった言葉のゲームを断念した記憶がある。機械学習が容易に利用できる今ならブレを簡単に吸収できる。どうやらぼくは8年ぐらい時代を先取りしていたようだ。今なら何でもできそうな気がする。まずは、『カオス川柳ジェネレータ』を復活させるところから始めるか。