• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2000 年度 実績報告書

言語横断型知識発掘システムに関する研究

研究課題

研究課題/領域番号 11480088
研究機関奈良先端科学技術大学院大学

研究代表者

植村 俊亮  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00203480)

研究分担者 波多野 賢治  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)
天笠 俊之  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (70314531)
吉川 正俊  奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30182736)
渡邉 正裕  国立特殊教育総合研究所, 教育工学研究部, 研究員 (80321595)
前田 亮  日本学術振興会, 特別研究員
キーワード多言語 / 知識 / 発掘 / データベース
研究概要

本研究は,ある言語で表現された情報資源に対して,それとは別の言語を使って問い合わせることができたり,複数の異なる言語で表現された情報資源の集まりに対して,自分の一番使いやすい言語を使って,問合せを出し,必要な情報を発掘することができるような,多言語機能をもつ知識発掘システムの実現を目指すものである.これを利用することによって,例えば,英語のホームページの集まりに対して,日本語で質問を出して,必要な知識を獲得することや,さまざまな言語を使ったホームページの集まりに対して,だれでも自分の一番得意な言語(母国語)を使って問い合わせ,知識を発掘することが可能となる.
平成12年度は,平成11年度で検討した日本語・英語間の言語横断情報検索技術をさらに発展させるための研究を行った.対訳辞書を用いた検索語の翻訳手法を改良し,並列コーパスや類義語辞典,WWWからの情報を用いて,より精度の高い訳語の導出を行う方式を開発した.具体的には,機械翻訳の技術と統計的手法を用い,効果的な多義性の除去を可能としている.これによって,従来よりも自然な訳語の選択が可能となった.さらに,XML等に代表される構造化文書を対象とした,精度の高い情報検索手法を開発した.

  • 研究成果

    (4件)

すべて その他

すべて 文献書誌 (4件)

  • [文献書誌] 前田亮,関慶妍,吉川正俊,植村俊亮: "Web文書の符号系および使用言語の自動識別"電子情報通信学会論文誌D-II. J84・D-II. 115-130 (2001)

  • [文献書誌] 前田亮,吉川正俊,植村俊亮: "前田亮,吉川正俊,植村俊亮"情報処理学会論文誌;データベース. 61・SIG6. 12-21 (2000)

  • [文献書誌] Akira Maeda,Fatiha Sadat,Masatoshi Yoshikawa,and Shunsuke Uemura: "Query Term Disambiguation for Web Cross-Language Information Retrieval using a Search Engine"Proc.of the 5th International Workshop on Information Retrieval with Asian Languages(IRAL2000). 25-32 (2000)

  • [文献書誌] Sadat Fatiha,Akira Maeda,Masatoshi Yoshikawa,and Shunsuke Uemura: "Integrating Dictionary-based and Statistical-based Approaches in Cross-Language Information Retrieval"情報処理学会データベースシステム研究会報告. DBS-121-1-10. (2000)

URL: 

公開日: 2002-04-03   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi