研究概要 |
本年度は,複数の対訳辞書を組み合わせた言語横断検索の手法について研究を行った.具体的には,問合せ言語として日本語,検索対象言語としてタイ語を用い,中間言語として英語を用いて問合せを翻訳する場合について検討した.問合せの翻訳には,インターネット上で提供されている対訳辞書サイトを用いたが,その際に発生する訳語の曖昧性は,中間言語を介する場合,非常に大きくなる.その曖昧性解消のために,ロボット型Web検索エンジンから得られる単語共起頻度に基づく単語間の関連度を用いる手法について研究を行った.また,この手法の研究と並行して,ディレクトリ型Web検索エンジン(Webディレクトリ)のカテゴリを用いて訳語曖昧性解消を行う手法についても研究を行った. 前者の手法の有効性を評価するため,国立情報学研究所によって作成されたNTCIR(NII-NACSIS Test Collection for IR Systems)の言語横断情報検索のテストコレクションを用い,辞書のみを用いて問合せを翻訳した場合と,提案手法によって曖昧性を解消した場合の検索性能の比較実験を行った.この実験では,言語横断情報検索における最低限の実用的な検索精度の指標として,単言語検索の50%の検索性能を得ることを目標としたが,検索対象文書と曖昧性解消に用いる文書とのドメインの相違が影響し,期待された検索性能は得られなかった.このため,今後は曖昧性解消に用いる文書を検索対象文書とある程度一致させた上で検索性能の評価実験を行う必要があると考えられる.一方,Webディレクトリを用いた曖昧性解消の実験では,曖昧性解消を行わない場合と比較して平均適合率が約16ポイント向上し,本手法の有効性が確認できた.
|