2001 Fiscal Year Annual Research Report
Project/Area Number |
11680432
|
Research Institution | National Institute of Informatics |
Principal Investigator |
安達 淳 国立情報学研究所, 情報学資源研究センター, 教授・センター長 (80143551)
|
Co-Investigator(Kenkyū-buntansha) |
高須 淳宏 国立情報学研究所, ソフトウェア研究系, 助教授 (90216648)
|
Keywords | 情報検索 / 構造化インデクス / 形態素解析 / テストコレクション / 言語横断検索 / 二分木 / 係り受け |
Research Abstract |
本研究では、情報検索システムにおいて従来の単語単位のキーワード索引ではなく、たとえば論文表題や梗概などを構成する文の単語間の係受け関係に着目し、二分木状の構造を持つ索引を用意することを検討した。それにより検索性能を向上し、質問者の意図に一層適合した的確な答えを得るような方式が提案できる。さらにそれを概念の検索に応用することにより、言語を越えた情報検索に適用する方式を実現することを目的としている。 最終年度として研究のまとめを目指して日本語と英語の情報検索に対する提案手法の比較検討を行った。まず、英語の情報検索を実現し、英語のテストコレクション(NTCIRおよびTREC)を使用して、各種インデクスの性質を実験的に評価した。日本語と英語に関する処理を比較し、言語依存の部分と言語独立の部分を分離し、構造化インデクスを実現するための一般的手法を整理した。また、これに合わせて既存の処理ソフトウェアを再構成して、実験環境を整備した。 言語横断検索に関しては、並行して研究を進めてきた関連性の重ね合わせ(RS)モデルによる検索の方が効果的であることが評価結果から出てきたため、主にこれに沿って言語横断検索の性能比較と性能改善の手法を見いだすための実験を進めた。その結果、日英の両言語で良好な性能を発揮できる見込みが得られた。 検索処理のソフトウェアに関しては、言語に左右されない処理部分とそうでない部分に分離して、多言語に対応できるような構造を持ったソフトウェアとして実装を行った。また利用者インターフェースも実装し、デモできるようにした。 最後に本研究の成果をまとめ報告書を作成した。
|
Research Products
(2 results)
-
[Publications] 松村敦: "情報検索における単語間の関係の効果"情報処理学会データベース研究会資料. 125-34. 257-264 (2001)
-
[Publications] 安達淳: "メタデータを中心に構成した文書画像の電子図書館システム"信学論D-I. Vol.J84-D-I, No.6. 768-776 (2001)