2009 Fiscal Year Annual Research Report
類義語検索とタグ付き自然言語検索を組み合わせた意外で価値ある情報の発見支援
Publicly Offered Research
Project Area | Cyber Infrastructure for the Information-explosion Era |
Project/Area Number |
21013051
|
Research Institution | National Institute of Information and Communications Technology |
Principal Investigator |
鳥澤 健太郎 National Institute of Information and Communications Technology, 知識創成コミュニケーション研究センター 言語基盤グループ, グループリーダー (70282712)
|
Co-Investigator(Kenkyū-buntansha) |
村田 真樹 鳥取大学, 大学院・工学研究科 情報エレクトロニクス専攻, 教授 (50358884)
風間 淳一 独立行政法人 情報通信研究機構, 知識創成コミュニケーション研究センター 言語基盤グループ, 主任研究員 (60377439)
山田 一郎 独立行政法人 情報通信研究機構, 知識創成コミュニケーション研究センター 言語基盤グループ, 専門研究員 (70536169)
黒田 航 独立行政法人 情報通信研究機構, 知識創成コミュニケーション研究センター 言語基盤グループ, 専門研究員 (30425764)
STIJN De saeger 独立行政法人 情報通信研究機構, 知識創成コミュニケーション研究センター 言語基盤グループ, 専門研究員 (40535994)
|
Keywords | インターネット高度化 / 情報検索 / 知識獲得 / 自然言語 / 意味ネットワーク / テキストマイニング / 言語資源 / ネット検索 |
Research Abstract |
本研究の目的は、平成20年度までに開発した検索ディレクトリ「鳥式」にあるトラブル、ツールのような固定されたカテゴリに加えて、ユーザが、鳥式上の関連語の新規なカテゴリを設定することを可能とし、また相互に意味的な関係のある複数の関連語を一度に提示し、情報の深堀りを可能とすることである。 本年度はタグ付き自然言語クエリによって、単語間の意味的関係、つまり、特定の意味的関係を持つ単語対、を精度良く抽出する手法を開発し、さらにその単語間の意味的関係を類推によって、精度良く拡張する手法を開発した。より具体的には、既存の言語的パターンによる単語間の意味的関係の獲得手法に、単語の意味クラスによる制限を加えて、多義なパターンを用いても意図した意味的関係を持つ単語の対のみが抽出できる手法を開発した。 また、上記手法によって大量に獲得した意味的関係を出発点として、いわゆる「類推」によって、意図した意味的関係を持つ大量の単語の対を獲得する手法も開発した。既存の意味的関係の自動抽出手法は、ほとんど全て、言語的パターンを用いており、パターンの出現頻度で獲得できる意味的関係の量が制限されるが、この類推による意味的関係の獲得手法は、そうしたパターンを一切用いず、その頻度による制限とは無縁であり、より大量の意味的関係を抽出することができる。また、その獲得制度もかなり高いことが確認された。また、この手法は、そもそもテキストに書かれていないが、意図した意味的関係を持つ未知の単語対を獲得することも可能であり、科学技術の研究開発、ビジネスなどにおいて、イノベーションの支援として活用することが可能である。
|
Research Products
(9 results)