2008 Fiscal Year Annual Research Report
検索要求の具体化を支援する巨大ディレクトリの自動生成
Project/Area Number |
19024034
|
Research Institution | National Institute of Information and Communications Technology |
Principal Investigator |
鳥澤 健太郎 National Institute of Information and Communications Technology, 知識創成コミュニケーション研究センター 言語基盤グループ, グループリーダー (70282712)
|
Co-Investigator(Kenkyū-buntansha) |
風間 淳一 独立行政法人 情報通信研究機構, 知識創成コミュニケーション研究センター 言語基盤グループ, 研究員 (60377439)
|
Keywords | インターネット高度化 / 情報検索 / 知識獲得 / 自然言語 / プラン認識 / テキストマイニング / 言語資源 / ネット検索 |
Research Abstract |
適切な行動をとるための情報収集に, 検索エンジンを利用するのはもはや常識である. つまりは, 様々なトピックに関する問題回避, あるいは行動に関する未知のアイディア, Tipsについて情報を求めるため, 検索エンジンを利用するということである. ところが, そうした情報を得るにはユーザから見て「意外」なキーワードを入力する必要がしばしばある. 本プロジェクトでは, こうしたキーワードの想起を支援し、ユーザが「意外でありながら有用な情報」を発見することを支援する技術を開発することを目的とした。具体的には、「鳥式」という検索ディレクトリを開発している. これは, ユーザが最初に入力したキーワード, つまり, トピックに対して, 関連語を意外なものまで含めて提示し, 検索に利用できるようにする. 本年度取り組んだ課題は、単語クラスタリングの大規模化とアナロジーによる検索での利用、上位下位関係DBの精度, カバレージ向上、トラブル表現の精緻化, 因果関係の自動獲得手法の開発である。これらの成果はすでに鳥式に組み込まれ、例えば、自殺のツールとして正露丸を使うことがネット上で議論されているなど意外な情報を実際に発見するのに貢献している。こうした研究は知識獲得という枠組みの一部として捉えられるが、実社会にインパクトのあるこうした情報を実際に大規模に獲得した例はこれまでにない。こうした技術は、平成21年度やはり情報爆発IT基盤で採択された類義語を用いた自然言語文検索において、さらに一般化され、より多様なユーザのニーズに応えられるように拡張される予定である。
|