検索要求の具体化を支援する巨大ディレクトリの自動生成
Project/Area Number |
19024034
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Review Section |
Science and Engineering
|
Research Institution | National Institute of Information and Communications Technology (2008) Japan Advanced Institute of Science and Technology (2007) |
Principal Investigator |
鳥澤 健太郎 National Institute of Information and Communications Technology, 知識創成コミュニケーション研究センター 言語基盤グループ, グループリーダー (70282712)
|
Co-Investigator(Kenkyū-buntansha) |
風間 淳一 独立行政法人 情報通信研究機構, 知識創成コミュニケーション研究センター 言語基盤グループ, 研究員 (60377439)
|
Project Period (FY) |
2007 – 2008
|
Project Status |
Completed (Fiscal Year 2008)
|
Budget Amount *help |
¥5,600,000 (Direct Cost: ¥5,600,000)
Fiscal Year 2008: ¥2,800,000 (Direct Cost: ¥2,800,000)
Fiscal Year 2007: ¥2,800,000 (Direct Cost: ¥2,800,000)
|
Keywords | インターネット高度化 / 情報検索 / 知識獲得 / 自然言語 / プラン認識 / テキストマイニング / 言語資源 / ネット検索 |
Research Abstract |
適切な行動をとるための情報収集に, 検索エンジンを利用するのはもはや常識である. つまりは, 様々なトピックに関する問題回避, あるいは行動に関する未知のアイディア, Tipsについて情報を求めるため, 検索エンジンを利用するということである. ところが, そうした情報を得るにはユーザから見て「意外」なキーワードを入力する必要がしばしばある. 本プロジェクトでは, こうしたキーワードの想起を支援し、ユーザが「意外でありながら有用な情報」を発見することを支援する技術を開発することを目的とした。具体的には、「鳥式」という検索ディレクトリを開発している. これは, ユーザが最初に入力したキーワード, つまり, トピックに対して, 関連語を意外なものまで含めて提示し, 検索に利用できるようにする. 本年度取り組んだ課題は、単語クラスタリングの大規模化とアナロジーによる検索での利用、上位下位関係DBの精度, カバレージ向上、トラブル表現の精緻化, 因果関係の自動獲得手法の開発である。これらの成果はすでに鳥式に組み込まれ、例えば、自殺のツールとして正露丸を使うことがネット上で議論されているなど意外な情報を実際に発見するのに貢献している。こうした研究は知識獲得という枠組みの一部として捉えられるが、実社会にインパクトのあるこうした情報を実際に大規模に獲得した例はこれまでにない。こうした技術は、平成21年度やはり情報爆発IT基盤で採択された類義語を用いた自然言語文検索において、さらに一般化され、より多様なユーザのニーズに応えられるように拡張される予定である。
|
Report
(2 results)
Research Products
(23 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] トラブルを見つける2008
Author(s)
Stijn De Saeger、鳥澤健太郎
Organizer
言語処理学会第14回年次大会
Place of Presentation
東京大学
Year and Date
2008-03-20
Related Report
-
-
-