研究概要 |
オーガナイザーとしてNTCIRワークショップ5に参加し、言語横断検索(CLIR)タスクの運営を行なうとともに、CLIRタスクへの参加者の提出結果(検索結果)のプーリング作業および検索結果の評価・分析を行なった。プーリング作業の過程で、どのようにプールを作成すればよいかという試行錯誤を行ない、メタサーチエンジン構築のためのデータ・フユージョン手法の予備的な考察としても役立てられる、検索結果のマージ手法について検討した。 また、引き続き、NTCIRワークショップ3,4における各参加者からの提出結果をプーリング法のパラメタを変化させ、検索手法・マージ手法等ごとのプールに分けて、統計的な評価を行ない、検索手法とマージ手法の効果的な組み合わせについて分析・検討した。 NTCIRテストコレクションの検索課題の自然言語処理的な分析を行い、自然言語文からの検索語の抽出・選択、検索式の構築・拡張の方法について検討したが、メタサーチエンジン上で統一的に一つの検索式を使用するか、あるいは、サーチエンジンごとの特徴に合わせて検索式を形式だけでなく内容もカスタマイズする必要があるのか、どちらが検索式の入力や選択として有効であるかを知るためには、さらなる実験と分析が必要であることがわかった。 さらに、分析結果を検討するため、既存の複数のサーチエンジンを組み込んだメタサーチエンジンの開発を行なったが、個々のサーチエンジンの特徴を十分生かすようなマージ手法の実装までには至らなかった。
|