研究分担者 |
波多野 賢治 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)
天笠 俊之 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (70314531)
吉川 正俊 名古屋大学, 情報連携基盤センター, 教授 (30182736)
石川 正敏 島根県立大学, 総合政策学部, 助手 (90332973)
渡邉 正裕 国立特殊教育総合研究所, 情報教育研究部, 助手 (80321595)
|
研究概要 |
本研究では,次の多言語機能をもつ知識発掘システムの実現を目指す.(1)ある言語で表現された情報資源に対して,それとは別の言語を使って問い合わせることができる.例えば,英語のホームページの集まりに対して,日本語で質問を出して,必要な知識を獲得することを可能にする.(2)複数の異なる言語で表現された情報資源の集まりに対して,自分の一番使いやすい言語を使って,問合せを出し,必要な情報を発掘することができる,例えば,さまざまの言語を使ったホームページの集まりに対して,だれでも自分の一番得意な言語(母国語)を使って問い合わせ,知識を発掘することを可能にする. さらに,こうした多言語情報資源と在来型のデータベースとの融合についても研究する.すなわち,ある言語で書かれたXML文書のなかのキーワードと,別の言語で実現しているデータベースの中のキーワードとを関連づけて,両者を融合させる方式を研究する. 本年度は,昨年度に引き続き多言語知識発掘システム実現のための基礎項目の研究を実施した.具体的には,・対訳辞書を用いた検索語の翻訳手法,および並列コーパスによる統計的手法などを用いた効果的な多義性の除去手法 大量の多言語HTML/XML文書格納のためのHTML/XML文書データベースの開発を行なった 得られた研究成果は適宜国内外の研究集会にて発表した.
|