研究概要 |
適切な行動をとるための情報収集に, 検索エンジンを利用するのはもはや常識である. つまりは, 様々なトピックに関する問題回避, あるいは行動に関する未知のアイディア, Tipsについて情報を求めるため, 検索エンジンを利用するということである. ところが, そうした情報を得るにはユーザから見て「意外」なキーワードを入力する必要がしばしばある. 本プロジェクトでは, こうしたキーワードの想起を支援し、ユーザが「意外でありながら有用な情報」を発見することを支援する技術を開発することを目的とした。具体的には、「鳥式」という検索ディレクトリを開発している. これは, ユーザが最初に入力したキーワード, つまり, トピックに対して, 関連語を意外なものまで含めて提示し, 検索に利用できるようにする. 本年度取り組んだ課題は、単語クラスタリングの大規模化とアナロジーによる検索での利用、上位下位関係DBの精度, カバレージ向上、トラブル表現の精緻化, 因果関係の自動獲得手法の開発である。これらの成果はすでに鳥式に組み込まれ、例えば、自殺のツールとして正露丸を使うことがネット上で議論されているなど意外な情報を実際に発見するのに貢献している。こうした研究は知識獲得という枠組みの一部として捉えられるが、実社会にインパクトのあるこうした情報を実際に大規模に獲得した例はこれまでにない。こうした技術は、平成21年度やはり情報爆発IT基盤で採択された類義語を用いた自然言語文検索において、さらに一般化され、より多様なユーザのニーズに応えられるように拡張される予定である。
|