IBM の「ワトソン」の話を聞いてきました
先日、IBMの大和研究所が移転して、新たに豊洲に東京ラボラトリーを開所したとのおしらせをいただき、記念セミナーに呼んでいただきました。
IBMの研究所といってもいろいろあるそうなんですが、東京ラボラトリーは基礎、ハードウェア、ソフトウェア、3つが揃っていて、強力なんです、というお話がメインだったわけなんですが、個人的に、俄然、興味があったのが、基礎の部分で、IBMが誇るコンピュータ「ワトソン」のお話でした。アメリカでクイズ王を倒した、クイズを解くすごいコンピュータ「ワトソン」の開発に係わった武田さんのお話を聞けるということで、とても楽しみにいってきました。ということで、その部分だけブログしてみました。
ワトソンのプロジェクトが始まったのは2006年。lBM 100周年にあわせたグランドチャレンジということで、武田さんも本当にできるのかなと、当初は思ったそうです。ちなみに、IBM のグランドチャレンジというと、チェスで世界一になった Deep Blue 以来15年振りなんだそうです。
ワトソンのチャレンジは人間のように考えるコンピュータ。人間には簡単でもコンピュータには難しい分野です。そう聞いて思い出すのが、あの、第五世代コンピュータプロジェクト。多額の予算をつぎ込んだけど、うまくいかず、いまや大失敗プロジェクトの代名詞です。いや、まったく成果がなかったわけではなくて、実はワトソンでも Prolog が一部で使われているとのことでしたが、どれだけ難しいかよくわかるので、ワトソンも同じことにならなければ、と思っていたそうです。
当時とワトソンの大きな違いは、大量にアクセスできる情報。ワトソンもエキスパートシステムだが、各種の辞書だけでなく、ウィキペディアを始めとした大量の情報がネット上に存在していて、それらも利用している。フォークソノミーな情報を分析して大量にアクセスできるようにしたことで、ワトソンはクイズにチャレンジできるだけの能力を得られたのだそうです。そういう意味ではインターネットの申し子的存在ですね。
ワトソンが挑戦したのは「Jeopardy!」というクイズ番組で、50年以上前からある歴史のある番組。ここで、歴代でも強力なチャンピオン二人、74連勝したというケン・ジェニングスとそのケンを越えて賞金王なブラッド・ラッターを相手に3日間参加しました。単純にクイズを解くだけでなく、問題の分野や賞金の選択もゲームの一環ということであわせて考えないといけなくて、これを含めてワトソンはチャレンジしたのだそうです。ふむふむ。
ちなみに、ワトソンは実際の番組では、クイズの問題をテキストデータでもらって、答えがわかると圧縮空気をつかってボタンを押すようになっていたそうです。30分の番組で問題は60問+2問もあるので、答えるまでの時間はわずか数秒。長い文章の問題では、問題を読みあげる時間の分だけ、優位に働いたこともありましたが、短い文章の問題では、答えは正しく予測できても、スピードでチャンピオンに勝てないこともありました。
ワトソンの問題の正答率はだいたい90%くらい。90%になるまで、さまざまな調整が行われたそうです。問題文章の解析、回答の候補の抽出、どの候補が回答か逆に解析して、根拠付け、すなわち、回答の可能性が高いものを見つれられれば回答する、といったようにできています。でも、単純に言葉の一致を評価していたら、回答には辿りつけず、さらには誤った回答を導き出すことになりがちです。ちゃんと文章の意味を解析し、いくつか重要なポイントについて、違う表現の文章でも同じ意味をもつもの、例えば年代や場所、名前など、それを関連づけられるようにしているんだそうです。人間だと「1年前」と「2011年」は同じだとすぐにわかるけど、コンピュータにそれをさせるのはとても難しいですね。過去問をたくさん問いて、統計モデル化。これを2880コアで並列処理することによって、クイズ番組の短い時間に結果をだしています。
もちろん、ワトソンは万能ではなくて、一定量の知識、情報が存在する分野で回答を探索することに関しては、一定の性能を発揮できるそうです。いまは医療の分野、症状から病名の候補を探索することについて実用を目指しているとのこと。でも、それ以外の問題についてはそうでもなく、Siri みたいなこともできません、とのお話でした。
ということで、ワトソンについて、あれこれ教えてもらいました。いま、家庭用にワトソンくんを一台ほしいといったら、いくらかかるんでしょうか。ワトソンがパーソナルになるまで、どれくらいの時間がかかるかわかりませんが、そうなるといろいろ便利になっていいですね。夢が広がる話を聞けてとてもよかったです。ありがとうございました。
Comments