研究概要 |
情報検索システムに対して利用者が発するクエリの裏側には,背景や文脈といったことが存在する.これらはより正確な情報要求の実現に向け検索に利用されるべきものであるが,その獲得には複雑な言語処理が必要となる.本研究では,クエリに含まれるキーワード間の関係を構造化し,情報検索の場面で有効な論理式へと変換することによって,利用者の意図を理解する知的情報検索システムの実現を目的としている. 本年度の成果は以下のとおりである. 適合条件文と不適合条件文の自動獲得 情報検索システム用テストコレクションであるNTCIR-2の検索質問を分析した.その結果,利用者の情報要求に対する文書の適合,不適合の条件を述べた文が存在することが分かった.これらを人手で抽出し,その文末特徴を利用することによって,適合条件文と不適合条件文の自動獲得を実現した. クエリの論理式変換 適合条件文および不適合条件文は,適合・不適合を示す文末表現と,その内容を示す句に分割可能であることが明らかになった.検索戦略としては,これら二つの部分の特徴を反映した別々の方法を適用する枠組を考案した. 1.適合・不適合を表す文末表現は,多くはその前の句に含まれる内容の適合・不適合のみを示すため,従来からの論理式による集合演算にある程度は置き換えが可能である.文末表現とこれらの演算の対応を分析し,文末表現を論理式へ置き換えることを行なった. 2.内容を示す句は,単純な論理式で表現することは不可能である.そこで句内のキーワードを抽出し,それらの間に存在する語間関係を字面情報と形態素情報として収集し分類した.これらを論理式の拡張ととらえ,体系化を試みた. 検索予備実験 文末表現を除いた句が単純な名詞句になる不適合条件文を含む検索質問文を対象として,上記枠組で予備的な検索実験を行ない,検索精度の向上を確認した.
|