研究分担者 |
波多野 賢治 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)
天笠 俊之 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (70314531)
吉川 正俊 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30182736)
渡邉 正裕 国立特殊教育総合研究所, 教育工学研究部, 研究員 (80321595)
前田 亮 日本学術振興会, 特別研究員
|
研究概要 |
本研究は,ある言語で表現された情報資源に対して,それとは別の言語を使って問い合わせることができたり,複数の異なる言語で表現された情報資源の集まりに対して,自分の一番使いやすい言語を使って,問合せを出し,必要な情報を発掘することができるような,多言語機能をもつ知識発掘システムの実現を目指すものである.これを利用することによって,例えば,英語のホームページの集まりに対して,日本語で質問を出して,必要な知識を獲得することや,さまざまな言語を使ったホームページの集まりに対して,だれでも自分の一番得意な言語(母国語)を使って問い合わせ,知識を発掘することが可能となる. 平成12年度は,平成11年度で検討した日本語・英語間の言語横断情報検索技術をさらに発展させるための研究を行った.対訳辞書を用いた検索語の翻訳手法を改良し,並列コーパスや類義語辞典,WWWからの情報を用いて,より精度の高い訳語の導出を行う方式を開発した.具体的には,機械翻訳の技術と統計的手法を用い,効果的な多義性の除去を可能としている.これによって,従来よりも自然な訳語の選択が可能となった.さらに,XML等に代表される構造化文書を対象とした,精度の高い情報検索手法を開発した.
|