研究概要 |
近年,World Wide Web上の検索エンジンを使って様々な調べ物や捜し物をすることが日常的になっている.しかし,Webには統制がないため,必要な情報だけを選別し,複数の情報を結び付けて解を見出す作業はユーザにゆだねられている.この問題を解消するために,既存の情報検索を超える知識検索の技術について研究を行っている.本研究が目指す知識検索とは,Webに潜在するにも拘らず,キーワードやカテゴリでは見つけることが難しい「人々の知識や考え」を取り出す作業である.そこで,種々の観点に基づいてWeb情報を体系化することを目的としている.2009年度は主に2つの課題に取り組んだ.まず,本研究で研究開発してきた事典的な検索システムの高度化を行った.本システムは,様々な用語に関する解説的な記述をWebや特許情報から抽出し,説明の観点に基づいて要約することでユーザの情報取得を支援する.しかし,説明の観点は対象の用語によって異なるため,様々な用語に対して説明の観点を網羅的に用意することは時間と労力がかかる.本研究はWikipediaの記事集合から「人間が用語を編集する仕組み(用語説明のモデル)」を自動構築することでこの問題を解消した.もう一つの課題として,企業や商品などの評判情報をWebから効率よく検索する手法について研究した.本研究の特長は,Web上の評判情報では「隠語」が使われることが多いことに着目した点にある.本研究は,評判を検索する対象の事物(企業名など)から,人間が考えそうな隠語を自動生成し,その隠語集合を用いてWebを検索する.そのため,隠語が造られるパターンを類型化し,隠語生成を自動化した.
|