2000 Fiscal Year Annual Research Report
Project/Area Number |
11480088
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
植村 俊亮 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00203480)
|
Co-Investigator(Kenkyū-buntansha) |
波多野 賢治 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)
天笠 俊之 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (70314531)
吉川 正俊 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30182736)
渡邉 正裕 国立特殊教育総合研究所, 教育工学研究部, 研究員 (80321595)
前田 亮 日本学術振興会, 特別研究員
|
Keywords | 多言語 / 知識 / 発掘 / データベース |
Research Abstract |
本研究は,ある言語で表現された情報資源に対して,それとは別の言語を使って問い合わせることができたり,複数の異なる言語で表現された情報資源の集まりに対して,自分の一番使いやすい言語を使って,問合せを出し,必要な情報を発掘することができるような,多言語機能をもつ知識発掘システムの実現を目指すものである.これを利用することによって,例えば,英語のホームページの集まりに対して,日本語で質問を出して,必要な知識を獲得することや,さまざまな言語を使ったホームページの集まりに対して,だれでも自分の一番得意な言語(母国語)を使って問い合わせ,知識を発掘することが可能となる. 平成12年度は,平成11年度で検討した日本語・英語間の言語横断情報検索技術をさらに発展させるための研究を行った.対訳辞書を用いた検索語の翻訳手法を改良し,並列コーパスや類義語辞典,WWWからの情報を用いて,より精度の高い訳語の導出を行う方式を開発した.具体的には,機械翻訳の技術と統計的手法を用い,効果的な多義性の除去を可能としている.これによって,従来よりも自然な訳語の選択が可能となった.さらに,XML等に代表される構造化文書を対象とした,精度の高い情報検索手法を開発した.
|
Research Products
(4 results)
-
[Publications] 前田亮,関慶妍,吉川正俊,植村俊亮: "Web文書の符号系および使用言語の自動識別"電子情報通信学会論文誌D-II. J84・D-II. 115-130 (2001)
-
[Publications] 前田亮,吉川正俊,植村俊亮: "前田亮,吉川正俊,植村俊亮"情報処理学会論文誌;データベース. 61・SIG6. 12-21 (2000)
-
[Publications] Akira Maeda,Fatiha Sadat,Masatoshi Yoshikawa,and Shunsuke Uemura: "Query Term Disambiguation for Web Cross-Language Information Retrieval using a Search Engine"Proc.of the 5th International Workshop on Information Retrieval with Asian Languages(IRAL2000). 25-32 (2000)
-
[Publications] Sadat Fatiha,Akira Maeda,Masatoshi Yoshikawa,and Shunsuke Uemura: "Integrating Dictionary-based and Statistical-based Approaches in Cross-Language Information Retrieval"情報処理学会データベースシステム研究会報告. DBS-121-1-10. (2000)