Budget Amount *help |
¥2,700,000 (Direct Cost: ¥2,700,000)
Fiscal Year 2003: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2002: ¥1,600,000 (Direct Cost: ¥1,600,000)
|
Research Abstract |
情報検索システムに対して利用者が発するクエリの裏側には,背景や文脈が存在する.これらはより正確な情報要求の実現に向け検索に利用されるべきものであるが,その獲得には複雑な言語処理が必要となる.本研究では,クエリに合まれるキーワード間の関係を構造化し,情報検索の場面で有効な論理式へと変換することによって,利用者の意図を理解する知的情報検索システムの実現を目的としている. 本年度の成果は以下のとおりである. 適合・不適合条件文の獲得 情報検索システム用テストコレクションであるNTCIR-2の検索質問の分析を行い,利用者の情報要求に対する文書の適合・不適合条件文の抽出精度を向上させた. クエリの構造化 適合・不適合条件文を文末表現と内容を表す句に分割するプロセスを文末表現辞書と形態素情報を利用して自動化することを行った.分割後,内容を表す句を係受けを考慮した三項関係の集合に変換し,これを内部表現として保持することを考案した.ただし,計算量の問題を回避するため,厳密な係受け解析は行わず,隣り合うキーワードとその間の関係を表す語の三項関係を全て抽出し,これを係受け関係の近似として取り扱った.この三項関係はキーワードとそれらの関係を表す語からなるが,これらを同定するためのルールを形態素情報を利用して作成し自動抽出を可能とした. 文書の構造化 クエリの内部表現を三項関係の集合としたため,文書も同様の内部表現にすることを訪みた.ただし,文書に含まれる文は文末表現を削除した後に三項関係を抽出した. 拡張論理式 三項関係の集合と文末表現を利用してクエリから検索式を構成する方法について検討した.適合・不適合を表現する文末表現はそのまま論理式へ変換することを行った.一方,三項関係の集合は明確にORの関係を示す「や」「または」などが存在する場合以外はANDとして扱った.ただし,特徴的な付属語である「以外」や「のみ」といった語の拡張問題が課題として残っている. 本研究では,クエリと文書の内部表現を係受け関係を利用した三項関係として構造化する枠組を考案した.また,この内部表現を使ってクエリを論理式へ変換することが可能となった.
|