研究課題/領域番号 |
13224001
|
研究機関 | 北海道大学 |
研究代表者 |
吉岡 真治 北海道大学, 大学院・工学研究科, 助教授 (40290879)
|
研究分担者 |
大久保 好章 北海道大学, 大学院・工学研究科, 助手 (40271639)
原口 誠 北海道大学, 大学院・工学研究科, 教授 (40128450)
|
キーワード | 情報検索 / 検索意図 / 電子化辞書 / シソーラス / 適合的汎化 |
研究概要 |
本研究では、検索意図を推定し、それをユーザにも理解しやすい形式で表現できる情報検索システムを提案する。ここでは、検索者が用いる検索語の抽象度に注目して、検索意図の推定を行う。 しかし、ユーザは、検索意図を表現するのに適切な抽象度の概念を必ずしも用いない場合がある。そのため、検索意図に応じた適切な抽象度の概念を検索キーワードに用いると、ユーザにも理解しやすく効率的な検索キーワードになると考えられる。 そのため、本研究では、電子化辞書やシソーラスに記述されている概念階層構造を利用し、検索意図に応じて検索キーワードを適合的に汎化する情報検索システムを提案する。ここで、適切な抽象度の汎化とは、検索キーワードが持つ正解判定の分別能力に関する情報を多く保存する汎化の事である。 一方、電子化辞書やシソーラスでは、一般的な概念階層が記述されているために、多段階の階層を用いた汎化を行った際に、一度に大量の語を代表する概念に汎化されてしまう問題がある。例えば、「ビデオ」と「DVD」を汎化した概念として「映像装置」という概念を考えたときに、8mmカメラは含むことは、検索意図と必ずしも一致しないと考えられる。そのため、ユーザが持つ細かな検索意図を適切に表現するために、検索目的に応じた適切な抽象概念を設定し、概念階層を再構築することが必要である。 本年度は、概念の適切な抽象化のための指標として、キーワードと正解文書の相互情報量に基づく関連性の指標を利用し、情報検索システムを構築した。本システムは、5件の正解文書を与えることにより、検索語の汎化を行い、検索者の意図が理解しやすい検索式が作成可能である。また、この検索式による検索は、他の検索システムと比較して十分な検索精度を持っていることを確認した。
|