研究課題/領域番号 |
16016201
|
研究機関 | 北海道大学 |
研究代表者 |
吉岡 真治 北海道大学, 大学院・情報科学研究科, 助教授 (40290879)
|
研究分担者 |
原口 誠 北海道大学, 大学院・情報科学研究科, 教授 (40128450)
大久保 好章 北海道大学, 大学院・情報科学研究科, 助手 (40271639)
|
キーワード | 情報検索 / 検索意図 / 電子化辞書 / シソーラス / 適合的汎化 |
研究概要 |
本研究では、検索意図を推定し、それをユーザにも理解しやすい形式で表現できる情報検索システムを提案する。ここでは、検索者が用いる検索語の抽象度に注目して、検索意図の推定を行う。しかし、ユーザは、検索意図を表現するのに適切な抽象度の概念を必ずしも用いない場合がある。そのため、検索意図に応じた適切な抽象度の概念を検索キーワードに用いると、ユーザにも理解しやすく効率的な検索キーワードになると考えられる。 そのため、本研究では、電子化辞書やシソーラスに記述されている概念階層構造を利用し、検索意図に応じて検索キーワードを適合的に汎化し、新たな検索式を作成する情報検索システムを提案する。ここで、適切な抽象度の汎化とは、検索キーワードが持つ正解判定の分別能力に関する情報を多く保存する汎化の事である。 本年度は、この適合的汎化による検索拡張が、正解文書において補完関係にある検索語の発見を目指しているという点に注目し、適合的汎化による検索拡張の結果をBoolean式として表現する方法と確率型情報検索モデルを組み合わせた情報検索システムを作成した。本システムを用い、情報検索システムの評価型ワークショップであるNTCIR4のWebタスクに参加し、本手法で提案したBoolean式の修正と確率型モデルの組み合わせによる情報検索システムが最も良い検索性能を実現することを確認し、本手法の有効性を確認した。
|