2007 Fiscal Year Annual Research Report
検索要求の具体化を支援する巨大ディレクトリの自動生成
Project/Area Number |
19024034
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
鳥澤 健太郎 Japan Advanced Institute of Science and Technology, 情報科学研究科, 准教授 (70282712)
|
Co-Investigator(Kenkyū-buntansha) |
風間 淳一 北陸先端科学技術大学院大学, 情報科学研究科, 助教 (60377439)
|
Keywords | インターネット高度化 / 情報検索 / 知識獲得 / 自然言語 / プラン認識 / テキストマイニング / 言語資源 / ネット検索 |
Research Abstract |
現代人は様々な事象に関して適切な問題回避,あるいはイノベーティブなアイディアを切実に求めており,検索エンジンはそのための格好のツールである,しかしながら,適切な問題回避,イノベーティブなアイディアを得る為には,そもそも各自にとって意外なキーワードを検索エンジンに与える必要が往々にしてある.本研究の目標は,そうした意外なものも含めた価値ある関連語を,ユーザーが最初に入力したトピックから求め,検索時に提示することである.価値ある関連語としては,ユーザーが入力する検索トピックの利用,対処に的を絞り,それに関連した多数の関連語を,トラブル,方法等のカテゴリに分類して提示し,ユーザーが意外なキーワードを探し出す支援を行なう.例えば,検索トピックとして「ディズニーランド」と入力すると,その利用に関する潜在的トラブルとして(アトラクションの)「身長制限」という関連語が提示される.これなどは,しばらく遊園地などには行っていない幼児の父親にとり,意外なキーワードであろう.今年度は、Web上の大量の文書から、トピックの利用、利用のための準備、トラブル、方法、ツール/材料といった、基本的な意味的カテゴリに分類される語を合計30万語以上自動抽出し、それらの語と128万語の検索トピックと関連づけ、それを利用する検索システム「鳥式」を開発した。「鳥式」はGUIによって関連語を提示し、また、それらの関連語は検索で利用することができる。また、128万語の検索トピックは自動獲得されたいわゆる上位下位関係によって組織化されており、これらの上位下位関係を利用した継承によって、「鳥式」は広範かつ有用度の高い関連語を提示することができる。
|