研究課題
オーガナイザーとしてNTCIRワークショップ4に参加し、言語横断検索(CLIR)タスクの運営を行なうとともに、CLIRタスクへの参加者の提出結果(検索結果)のプーリング作業および検索結果の評価・分析を行なった。プーリング作業の過程で、どのようにプールを作成すればよいかという試行錯誤を行ない、メタサーチエンジン構築のためのデータ・フュージョン手法の予備的な考察としても役立てられる、検索結果のマージ手法について検討した。また、引き続き、NTCIRワークショップ3における各参加者からの提出結果をプーリング法のパラメタを変化させ、検索手法・マージ手法等ごとのプールに分けて、統計的な評価を行ない、検索手法とマージ手法の効果的な組み合わせについて分析・検討した。大規模テストコレクションNTCIR-3の言語横断検索システム評価用データの適合文書リストは、NTCIRワークショップ3の言語横断検索タスクにおいて各参加者から提出された検索結果を用いて、プーリング法に基づいて作成された。本研究では、NTCIR-3の作成過程において行なわれた、サブタスク混合プーリングが適合文書リストの網羅性を高めるのに有効であったかどうかについて考察を行なった。NTCIRワークショップ3の提出結果を用いて、日本語文書についてのプーリング実験を行なった結果、単言語検索タスクの提出結果だけでなく、言語横断検索タスクの提出結果も、適合文書リストの網羅性を高めるのに貢献していることがわかり、サブタスク混合プーリングの効率性と有効性が確かめられた。
すべて 2004 その他
すべて 雑誌論文 (4件)
ACM SIGIR Forum Vol.38, Issue.1
ページ: 17-20
ページ: 39-45
Proc.of the 4th NTCIR Workshop (印刷中)