2002 Fiscal Year Annual Research Report
Project/Area Number |
11480088
|
Research Institution | NARA INSTITUTE OF SCIENCE AND TECHNOLOGY |
Principal Investigator |
植村 俊亮 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00203480)
|
Co-Investigator(Kenkyū-buntansha) |
波多野 賢治 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)
天笠 俊之 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (70314531)
吉川 正俊 名古屋大学, 情報連携基盤センター, 教授 (30182736)
石川 正敏 島根県立大学, 総合政策学部, 助手 (90332973)
渡邉 正裕 国立特殊教育総合研究所, 情報教育研究部, 助手 (80321595)
|
Keywords | 多言語知識発掘システム / 多言語コーパス / XMLデータベース / 言語横断検索 |
Research Abstract |
本研究では,次の多言語機能をもつ知識発掘システムの実現を目指す.(1)ある言語で表現された情報資源に対して,それとは別の言語を使って問い合わせることができる.例えば,英語のホームページの集まりに対して,日本語で質問を出して,必要な知識を獲得することを可能にする.(2)複数の異なる言語で表現された情報資源の集まりに対して,自分の一番使いやすい言語を使って,問合せを出し,必要な情報を発掘することができる,例えば,さまざまの言語を使ったホームページの集まりに対して,だれでも自分の一番得意な言語(母国語)を使って問い合わせ,知識を発掘することを可能にする. さらに,こうした多言語情報資源と在来型のデータベースとの融合についても研究する.すなわち,ある言語で書かれたXML文書のなかのキーワードと,別の言語で実現しているデータベースの中のキーワードとを関連づけて,両者を融合させる方式を研究する. 本年度は,昨年度に引き続き多言語知識発掘システム実現のための基礎項目の研究を実施した.具体的には,・対訳辞書を用いた検索語の翻訳手法,および並列コーパスによる統計的手法などを用いた効果的な多義性の除去手法 大量の多言語HTML/XML文書格納のためのHTML/XML文書データベースの開発を行なった 得られた研究成果は適宜国内外の研究集会にて発表した.
|
Research Products
(11 results)
-
[Publications] F.Sadat, A.Maeda, M.Yoshikawa, S.Uemura: "Statistical Query Disambiguation, Translation and Expansion in Cross-Language Information Retrieval"The LREC 2002 Workshop on Using Semantics for Information Retrieval and Filtering : state of the Art and Future Research. (CD-ROM). (2002)
-
[Publications] F.Sadat, A.Maeda, M.Yoshikawa, S.Uemura: "A Combined Statistical Query Term Disambiguation in Cross-Language Information Retrieval"The Third International Workshop on Natural Language and Information Systems (NLIS2002). 251-255 (2002)
-
[Publications] F.Sadat, M.Yoshikawa, S.Uemura: "Exploiting Thesauri and Hierarchical Categories in Cross-Language Information Retrieval"5th International Conference on Text, Speech and Dialogue (TSD 2002). 139-146 (2002)
-
[Publications] 木村文則, 前田亮, 吉川正俊, 植村俊亮: "ディレクトリ型検索エンジンを用いた言語横断情報検索"Forum on Information Technology 2002 (FIT). 第2分冊. 69-70 (2002)
-
[Publications] F.Sadat, A.Maeda, M.Yoshikawa, S.Uemura: "Exploiting and Combining Multiple Resources for Query Expansion in Cross-Language Information Retrieval"情報処理学会論文誌:データベース. SIG9(TOD15). 39-54 (2002)
-
[Publications] K.Hatano, H.Kinutani, M.Yoshikawa, S.Uemura: "Extraction of Partial XML Documents Using IR-based Structure and Contents Analysis"Conceptual Modeling for New Information Systems Technologies. 334-347 (2002)
-
[Publications] 杉山一成, 波多野賢治, 吉川正俊, 植村俊亮: "On Some Methods for Improving Feature Vectors for Web Pages and their Retrieval Accuracy"電子情報通信学会第14回データ光学ワークショップ(DEWS2003). (Web上公開予定). (2003)
-
[Publications] 木村文則, 前田亮, 吉川正俊, 植村俊亮: "Webディレクトリの階層構造を利用した言語横断検索"電子情報通信学会第14回データ工学ワークショップ(DEWS2003). (Web上公開予定). (2003)
-
[Publications] F.Sadat, M.Yoshikawa, S.Uemura: "Combining Multiple Knowledge Sources for an Efficient Query Expansion in Cross-Language Information Retrieval"Forum on Information Technology 2002 (FIT). 第2分冊. 67-68 (2002)
-
[Publications] F.Sadat, M.Yoshikawa, S.Uemura: "The Role of Query Expansion Techniques in French-English Information Retrieval"Journe'es Science and Technology Workshop 2002 (JST2002). (CD-ROM). (2002)
-
[Publications] F.Sadat, M.Yoshikawa, S.Uemura: "Cross-Language Information Retrieval Using Multiple Resources and Combinations for Query Expansion"Second International Conference on Advances in Information Systems (ADVIS2002). 114-122 (2002)