カレンダー

2019/04
 
252627
282930    
       

広告

Twitter

記事検索

ランダムボタン

最終回とコーパス

by 唐草 [2019/04/01]



 この日記の最終回ってどんなものになるんだろうか?ぼくとしては緻密に張り巡らされた伏線がひとつの大きな流れになって読む側が鳥肌を立ててしまうような展開にしたいと思っている。でも、残念なことに今現在この日記に伏線なんてものはひとつも存在していない。ぼくの文章力では、長い流れを作ることもまとめることもままならないだろう。
 現実的に考えると最終回はロウソクの火が消えるように前触れもなく更新が止まって、最後のエントリーがなし崩し的に最終回扱いとなるのだろう。更新が止まる原因としては、ぼくが飽きるか、死ぬかのどちらかだ。ぼくの飽きは、第三者からすればぼくの死と同等なのかもしれない。
 ただ、ぼくの本心としては最終回を未来永劫迎えたくないという強い思いがある。仮にぼくが記事を書けない状況に陥ったとしても、更新だけは自動継続してほしいと願っている。
 つい先日まで、この願いは夢物語の類だった。でも、テクノロジーの進歩によってほんの少しだけれども可能性が見えてきた。
 そう、AIの導入である。
 ここ数年でAIは目覚ましい発展をとげている。性能が向上したばかりでなく、開発ツールの充実とノウハウの蓄積によって誰もが手を出せる領域となってきている。文章生成はまだまだ発展途上の分野ではあるが、実用化されるのも時間の問題だろう。
 とは言え、見知らぬ誰かが作った汎用的な文章生成AIをこの日記に導入しても仕方がない。生身のぼくが書いている今の文章より読みやすい文章になるだろうが、言葉の選び方や話題の運び方に個性がなくなってしまう。ここに導入するのは汎用的なAIではなく、ぼくの分身というべき特化型AIでなければならないと考えている。
 じゃあ、ぼくの分身をどうやって作るのか。脳に電極を刺してコピーでも取れればいいのだが、そうもいかない。現在の手法でAI開発をするには大量の文章が必要になる。普通、そんなものは存在しない。でも、ぼくは違う。ここにある。この日記がまさにぼく自身のビッグデータである。
 現在、約5,000の記事が掲載されている。タグや改行を含めると10MB程度の文章があるし、それに付随する画像もある。これらを賢く利用すれば、ぼくの分身を作ることができるのではないだろうか?うまくいけば、中の人が亡き者になっても更新を継続できるかもしれない。
 夢は膨らむが、実現に至る道は極めて厳しく長い。まずは、ぼくの脳内辞書というべきコーパスを作るところから始めるか。他に類を見ないほど偏ったコーパスができること間違いなし。