2001 年度実績報告書

言語横断型知識発掘システムに関する研究

研究課題

研究課題/領域番号	11480088
研究機関	奈良先端科学技術大学院大学
研究代表者	植村俊亮奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00203480)
研究分担者	波多野賢治奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532) 天笠俊之奈良先端科学技術大学院大学, 情報科学研究科, 助手 (70314531) 吉川正俊奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30182736) 石川正敏島根県立大学, 総合政策学部, 助手 (90332973) 渡邉正裕国立特殊教育総合研究所, 情報教育研究部, 助手 (80321595)
キーワード	多言語知識発掘システム / 多言語コーパス / 多言語ブラウザ / 適合性フィードバック / 問合せ拡張 / XMLデータベース
研究概要	本研究はある言語で表現されたネットワーク上の情報資源に対して,それとは別の言語を使って問い合わせを行ない,必要な知識を獲得することのできるような多言語知識発掘システムの開発を目的としている.今年度は以下の項目について研究を行なった. ・昨年度に引き続き,文書と検索語の記述言語に依存しない文書検索方式の開発を進めた.具体的には,対訳辞書を用いた検索語の翻訳手法,および統計的手法を用いた効果的な多義性の除去方法によって,検索語を対象言語に翻訳することによってこれを実現する.今年度は,多言語コーパスを用いた多義性除去,問合せ拡張,適合性フィードバック等の複数の手法を効果的に組み合わせる手法を提案し,これまでと比べて検索精度を向上することができた. ・大量に発生する多言語HTML文書,多言語XML文書を効率良く管理するためのXMLデータベースアーキテクチャを検討した.まず,一般に広く普及している関係データベースを用いてこれらの文書を格納,検索する手法を開発た.さらにプロトタイプシステムを実装し,その有効性を検証した. ・多言語の電子文書を扱う際,システムにあらかじめフォントを用意しなくても検索,表示が可能となるようなフォント埋め込み型多言語文書データモデルを開発した.文書の記述にはXMLを用い,文書内容を表わす全文テキストに加えて,文書の見た目を表現するためのビットマップデータ,外字フォント,メタデータ等を含んでいる.漢字文献を対象に,提案モデルに基づいたプロトタイプシステムを実装し,その有効性を検証した、

研究成果

(7件)

すべてその他

すべて文献書誌 (7件)

[文献書誌] M.Yoshikawa, T.Amagasa, T.Shimura, S.Uemura: "XRel: A Path-Based Approach to Storage and Retrieval of XML Documents using Rela-tional Databases"ACM Transactions on Internet Technology. 1・1. 110-141 (2001)
[文献書誌] 波多野賢治, 渡邉正裕, 吉川正俊, 植村俊亮: "情報検索技術を用いた部分文書構造の自動抽出"情報処理学会論文誌:データベース. 42・SIG8(TOD10). 38-46 (2001)
[文献書誌] F.Sadat, A.Meada, M.Yoshikawa, S.Uemura: "Cross-Language Information Retrieval Via Dictionary-based and Statistics-based Methods"Proc. of 2001 IEEE Pacific Rim Conference on Communications, Computers and Signal Processing(PACRIM'01). II. 595-598 (2001)
[文献書誌] F.Sadat, A.Maeda, M.Yoshikawa, S.Uemura: "Query Expansion Tehnique for the CLEF Bilingual Track"Working Notes for the CLEF 2001 Workshop. 99-104 (2001)
[文献書誌] D.D.Kha, M.Yoshikawa, S.Uemur: "An XML Indexing Structure with Relative Region Coordinate"Proc of the 17th IEEE International Conference on Data Engineering(ICDE2001). 313-320 (2001)
[文献書誌] T.Amagasa, M.Yoshikawa, S.Uemura: "Realizing Temporal XML Repositories using Temporal Relational Databases"The Third International Symposium on Cooperative Database Systems for Advanced Applications (CODAS'2001). 63-67 (2001)
[文献書誌] Masatoshi Yoshikawa: ""XML Databases", In Nontraditional Database Systems-Results from the Japanese Project on Advanced Database"The Information Processing Society of Japan and Taylor & Books Ltd. (2002)

2001 年度 実績報告書

言語横断型知識発掘システムに関する研究

研究代表者

植村 俊亮 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00203480)

研究成果

[文献書誌] M.Yoshikawa, T.Amagasa, T.Shimura, S.Uemura: "XRel: A Path-Based Approach to Storage and Retrieval of XML Documents using Rela-tional Databases"ACM Transactions on Internet Technology. 1・1. 110-141 (2001)

[文献書誌] 波多野 賢治, 渡邉 正裕, 吉川 正俊, 植村 俊亮: "情報検索技術を用いた部分文書構造の自動抽出"情報処理学会論文誌:データベース. 42・SIG8(TOD10). 38-46 (2001)

[文献書誌] F.Sadat, A.Meada, M.Yoshikawa, S.Uemura: "Cross-Language Information Retrieval Via Dictionary-based and Statistics-based Methods"Proc. of 2001 IEEE Pacific Rim Conference on Communications, Computers and Signal Processing(PACRIM'01). II. 595-598 (2001)

[文献書誌] F.Sadat, A.Maeda, M.Yoshikawa, S.Uemura: "Query Expansion Tehnique for the CLEF Bilingual Track"Working Notes for the CLEF 2001 Workshop. 99-104 (2001)

[文献書誌] D.D.Kha, M.Yoshikawa, S.Uemur: "An XML Indexing Structure with Relative Region Coordinate"Proc of the 17th IEEE International Conference on Data Engineering(ICDE2001). 313-320 (2001)

[文献書誌] T.Amagasa, M.Yoshikawa, S.Uemura: "Realizing Temporal XML Repositories using Temporal Relational Databases"The Third International Symposium on Cooperative Database Systems for Advanced Applications (CODAS'2001). 63-67 (2001)

[文献書誌] Masatoshi Yoshikawa: ""XML Databases", In Nontraditional Database Systems-Results from the Japanese Project on Advanced Database"The Information Processing Society of Japan and Taylor & Books Ltd. (2002)

2001 年度実績報告書

植村俊亮奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00203480)

[文献書誌] 波多野賢治, 渡邉正裕, 吉川正俊, 植村俊亮: "情報検索技術を用いた部分文書構造の自動抽出"情報処理学会論文誌:データベース. 42・SIG8(TOD10). 38-46 (2001)