ロボットに文章が書ける?

 こんな記事がAPから出ていてマスコミはそれなりに反応しているようです。

014/7/9 0:12
 AP通信の広報担当者は7日、コンピュータープログラムを使って米企業の決算記事を自動作成する試みを週内にも始めると明らかにした。“ロボット記者”の登場により現在は四半期当たり300本の記事数を、10倍以上の4400本にすることが可能という。

 

」-- http://www.nikkei.com/article/DGXNASGM0802J_Y4A700C1FF1000/

 コンピュータが小説を書けるなどという妄想をテレビなどで口走っている解説者もいますが、なかなか噴飯ものなのですね。

 上記技術は50年も前から人工知能自然言語処理分野で存在していて、優秀な大学生の卒論レベルのものにすぎません。会社業績のプレスリリースから記事を書くというより、今流行のコピペ的に作るわけで、当然、プレスリリースの中には業績関係の言葉が出てきます。「経常利益」、「営業利益」、「赤字」、「黒字」などのキーワードを持つ文章を抜き出して並べてやれば、それで草稿はできます。あとは多少の手をいれてーー変数項をもつ定型文を用いるのでしょうーーリリースするだけです。

 ツイッターなどで「文法を完全に作れるのか」などというコメント、質問が出ていましたが、当然のことながら文法は完全に作ることはできません。というより、この程度のものは文法解析などの高度な技術は使わないのです。

 では、小説や、卒論が自動生成できるかと言いますと、それは当面、不可能です。人工知能は、言葉の「意味」がなんであるかの定義において、50年間、何もできていないのです。「意味」も分からず、文章を書くことができないことはわかりますね?

 人間は自分の脳が何をしているのか、自分の脳が何を知っているのかを認識できない動物なのです。それにも拘らず、分かっていない「意味」が日常言語として使われています。では、これをコンピュータに数学的厳密さを持って教えようーープログラミングしようーーとすると、何をしていいかわからなくなるのです。

 「犬」の意味とはなんでしょうか?国語辞書の記述は、説明であって意味ではありません。

 Yahoo辞書で「犬」を引きますと次のような記述が出てきます:

「犬1 食肉目イヌ科の哺乳類。嗅覚・聴覚が鋭く、古くから猟犬・番犬・牧畜犬などとして家畜化。多くの品種がつくられ、大きさや体形、毛色などはさまざま。警察犬・軍用犬・盲導犬・競走犬・愛玩犬など用途は広い。 2 他人の秘密などをかぎ回って報 ... デジタル大辞泉

 」

犬の意味が「食肉目イヌ科の哺乳類」であるのなら、「食肉目」、「イヌ科」、「哺乳類」の意味が必要になります。やってみればわかりますが、堂々巡りになるだけで、無知なコンピュータには何が何かわかりません。

つまり、言葉の意味は言葉では定義できないのです。人間は、犬を知っているので言葉の「犬」をわかったつもりになりますが、人間でも、「ふぁず」という未知の言葉の意味を知ろうとして辞書を引いたら、下記のように書かれていた場合、わかるでしょうか?

「ふぁず 1ちゅにあ の ひみうぇ ざわふ」

こんどは「ちゅにあ」「ひめうぇ」「ざわふ」を調べることになります。結局は何がなんだかわからないでしょう。言葉を言葉で説明する場合、既に、他の基本となる言葉の「意味」を知っていることが前提になります。コンピュータにはこの前提を適用できないのです。

 基本となる言葉の意味は、では人間はどうして取得しているかといいますと、実世界のなかで、目で見、手で触り、耳で聞くなどして現物として、それが何であるかを知って取得しているのです。歳が上にいき、脳が発達するとモノがない、抽象的な言葉も知るようになります。「夢」、「希望」、「恐れ」など、脳の体験によりその意味を知ります。コンピュータにそれをどのように体験させるのか??100年単位の課題でしょう。人間が要らなくなることはありません。

 この事を簡単に理解するには、日本を知らない外国人に、「豆腐」「こんにゃく」などを言葉だけで理解させられるか考えてみればわかります。まして、「侘び寂び」などはどうしてその意味をコンピュータに教えられるのでしょうか?

 ショートショート程度の小説とも言えない程度、俳句、など創造性を必要とすることをコンピュータに行わせる試みは行われていますが、玩具程度のプログラムは作れても、優秀な人間に匹敵するもの、実用的なものは、意味の分からないコンピュータには作ることができません。人工知能の世界ではこのような研究?でできたものを「toy system」と呼んでいます。玩具を作っているという意味です。

 ついでながら、将棋は強くなりました。人間のチャンピオンがコンピュータに勝てない時代は目の前にきています。これは、コンピュータの速度と記憶容量という「性能」が上がり、それで作動する数学的厳密性を持ったプログラムができているからです。つまり、「量」の問題であって、意味のような、それが何であるかわからないというような「質」の問題ではないので、コンピュータが速くなれば、人間はかなわなくなるのです。