• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

言語横断型知識発掘システムに関する研究

研究課題

研究課題/領域番号 11480088
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 情報システム学(含情報図書館学)
研究機関奈良先端科学技術大学院大学

研究代表者

植村 俊亮  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00203480)

研究分担者 波多野 賢治  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)
天笠 俊之  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (70314531)
吉川 正俊  奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30182736)
渡邉 正裕 (渡辺 正裕)  独立行政法人特殊教育総合研究所, 総合政策情報センター, 研究員 (80321595)
前田 亮  立命館大学, 理工学部・情報学科, 助教授 (20351322)
石川 正敏  島根県立大学, 総合政策学部, 助手 (90332973)
研究期間 (年度) 1999 – 2002
研究課題ステータス 完了 (2002年度)
配分額 *注記
14,800千円 (直接経費: 14,800千円)
2002年度: 1,800千円 (直接経費: 1,800千円)
2001年度: 4,500千円 (直接経費: 4,500千円)
2000年度: 5,000千円 (直接経費: 5,000千円)
1999年度: 3,500千円 (直接経費: 3,500千円)
キーワード多言語知識発掘システム / 言語横断型情報検索 / 並列コーパス / 訳語あいまい性除去 / 多言語コーパス / XMLデータベース / 言語横断検索 / 多言語ブラウザ / 適合性フィードバック / 問合せ拡張 / 多言語 / 知識 / 発掘 / データベース / 多言語処理 / 情報検索 / 単言語コーパス / 文字符号 / 相互情報量
研究概要

インターネット時代を迎えて,地球規模の情報資源が現出しつつあると言われる.WWW(World Wide Web)は,その典型的な例である.しかし,WWWは,ばらばらに構築された,言語も文化も異なるホームページが互いに接続されて,利用可能になっているだけであって,そこから真に必要な知識を発掘する方式はまだ確立されていない.
本研究では,WWWに代表される知識資源の大海から,必要な知識を発掘する方式を,とくにその多言語処理面から追求する.具体的には,次の多言語機能をもつ知識発掘システムの実現を目指す.
1.ある言語で表現された情報資源に対して,それとは別の言語を使って問い合わせることができる.例えば,英語のホームページの集まりに対して,日本語で質問を出すことを可能にする.
2.複数の異なる言語で表現された情報資源の集まりに対して,自分の一番使いやすい言語を使って,問合せを出し,必要な情報を発掘することができる、例えば,さまざまの言語を使ったホームページの集まりに対して,だれでも母国語を使って問い合わせ,知識を発掘することを可能にする.
多言語知識発掘システムのため本研究では以下の項目について研究を実践した.1)対訳辞書を用いた検索語の翻訳手法,および並列コーパスによる統計的手法などを用いた効果的な多義性の除去手法,2)フォント埋め込み型HTML/XML文書による多言語文書のブラウジングシステムの実現,3)大量の多言語HTML/XML文書格納のためのHTML/XML文書データベースの開発.

報告書

(5件)
  • 2002 実績報告書   研究成果報告書概要
  • 2001 実績報告書
  • 2000 実績報告書
  • 1999 実績報告書
  • 研究成果

    (52件)

すべて その他

すべて 文献書誌 (52件)

  • [文献書誌] 前田 亮, 吉川 正俊, 植村 俊亮: "言語横断情報検索におけるWeb文書群による訳語曖昧性解消"情報処理学会論文誌:データベース. 41 SIG6(TOD7). 12-21 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] 前田 亮, 関 慶妍, 吉川 正俊, 植村 俊亮: "Web文書の符号系および使用言語の自動識別"電子情報通信学会論文誌D-II. J84-D-II No.1. 150-158 (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Akira Maeda, Masatoshi Yoshikawa, Shunsuke Uemura: "Exploiting and Combining Multiple Resources for Query Expansion in Cross-Language Information Retrieval"情報処理学会論文誌:データベース. 43 SIG9(TOD15). 39-54 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Akira Maeda, Shunsuke Uemura: "Key Technologies for Multilingual Information Processing on WWW"Fourth International Symposium on Standardization of Multilingual Information Technology (MLIT-4). (CD-ROM). (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Akira Maeda, Fatiha Sadat, Masatoshi Yoshikawa, Shunsuke Uemura: "Query Term Disambiguation for Web Cross-Language Information Retrieval using a Search Engine"The Fifth Informational Workshop on Information Retrieval with Asian Languages (IRAL2000). 25-32 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Akira Meda, Masatoshi Yoshikawa, Shunsuke Uemura: "Cross-Language Information Retrieval Via Dictionary-based and Statistics-based Methods"2001 IEEE Pacific Rim Conference on Communications, Computers and Signal Processing (PACRIM'01). II. 26-28 (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Akira Meda, Masatoshi Yoshikawa, Shunsuke Uemura: "Query Expansion Technique for the CLEF Bilingual Track"Working Notes for the CLEF 2001 Workshop. 99-104 (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat: "Cross-Language Information Retrieval via Hybrid Combination of Query Expansion Techniques"The LREC 2002 Workshop on Using Semantics for Information Retrieval and Filtering : State of the Art and Future Research. (CD-ROM). (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Akira Maeda, Masatoshi Yoshikawa, Shunsuke Uemura: "A Combined Statistical Query Term Disambiguation in Cross-Language Information Retrieval"The ACL-02 Student Research Workshop. (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Akira Maeda, Masatoshi Yoshikawa, Shunsuke Uemura: "A Combined Statistical Query Term Disambiguation in Cross-Language Information Retrieval"The third International Workshop on Natural Language and Information Systems (NLIS2002). 251-255 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Masatoshi Yoshikawa, Sunsuke Uemura: "Exploiting Thesauri and Hierarchical Categories in Cross-Language Information Retrieval"5th International Conference on Text, Speech and Dialogues (TSD2002). 139-146 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Masatoshi Yoshikawa, Sunsuke Uemura: "Cross-Language Information Retrieval Using Multiple Resources and Combinations for Query Expansion"Second International Conference on Advances in Information Systems (ADVIS2002). 23-25 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Masatoshi Yoshikawa, Sunsuke Uemura: "The Role of Query Expansion Techniques in French-English Information Retrieval"Journees Science and Technology Workshop 2002 (JST2002). (CD-ROM). (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Akira Maeda, Masatoshi Yoshikawa, and Shunsuke Uemura: "Exploiting and Combining Multiple Resources for Query Expansion in Cross-Language Information Retrieval"Information Processing Society of Japan Transactions : Database. Vol.43, No.SIG9 (TOD15). 39-54 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Akira Maeda and Shunsuke Uemura: "Key Technologies for Multilingual Information Processing on WWW"Fourth International Symposium on Standardization of Multilingual Information Technology (MLIT-4),. (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Akira Maeda, Fatiha Sadat, Masatoshi Yoshikawa, and Shunsuke Uemura: "Query Term Disambiguation for Web Cross-Language Information Retrieval using a Search Engine"The Fifth International Workshop on Information Retrieval with Asian Languages (IRAL 2000). September 30-October 1. 25-32 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Akira Maeda, Masatoshi Yoshikawa, and Shunsuke Uemura: "Cross-Language Information Retrieval Via Dictionary-based and Statistics-based Methods"Proc.of 2001 IEEE Pacific Rim Conference on Communications, Computers and Signal Processing (PACRIM'01). Vol.II, Aug.26-28. 595-598 (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Akira Maeda, Masatoshi Yoshikawa and Shunsuke Uemura: "Query Expansion Technique for the CLEF Bilingual Track"Working Notes for the CLEF 2001 Workshop. Sep.3-4. 99-104 (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Akira Maeda, Masatoshi Yoshikawa, and Shunsuke Uemura: "Statistical Query Disambiguation, Translation and Expansion in Cross-Language Information Retrieval"The LREC 2002 Workshop on Using Semantics for Information Retrieval and Filtering : State of the Art and Future Research. June 2. (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat: "Cross-Language Information Retrieval via Hybrid Combination of Query Expansion Techniques"The ACL-02 Student Research Workshop. July 7-12. (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Akira Maeda, Masatoshi Yoshikawa, and Shunsuke Uemura: "A Combined Statistical Query Term Disambiguation in Cross-Language Information Retrieval"The Third International Workshop on Natural Language and Information Systems (NLIS2002). September 2-3. 251-255 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Masatoshi Yoshikawa, and Shunsuke Uemura: "Exploiting Thesauri and Hierarchical Categories in Cross-Language Information Retrieval"5th International Conference on Text, Speech and Dialogue (TSD 2002), Lecture Notes in Computer Science (LNCS), Springer-Verlag. Vol.2448, September 9-10. 139-146 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Masatoshi Yoshikawa, Shunsuke Uemura: "Cross-Language Information Retrieval Using Multiple Resources and Combinations for Query Expansion"Second International Conference on Advances in Information Systems (ADVIS2002), Lecture Notes in Computer Science (LNCS), Springer-Verlag. Vol.2457, October 23-25. 114-122 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Fatiha Sadat, Masatoshi Yoshikawa, and Shunsuke Uemura: "The Role of Query Expansion Techniques in French-English Information Retrieval"Journees Science and Technology Workshop 2002 (JST2002). November 17-19. (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] F.Sadat, A.Maeda, M.Yoshikawa, S.Uemura: "Statistical Query Disambiguation, Translation and Expansion in Cross-Language Information Retrieval"The LREC 2002 Workshop on Using Semantics for Information Retrieval and Filtering : state of the Art and Future Research. (CD-ROM). (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] F.Sadat, A.Maeda, M.Yoshikawa, S.Uemura: "A Combined Statistical Query Term Disambiguation in Cross-Language Information Retrieval"The Third International Workshop on Natural Language and Information Systems (NLIS2002). 251-255 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] F.Sadat, M.Yoshikawa, S.Uemura: "Exploiting Thesauri and Hierarchical Categories in Cross-Language Information Retrieval"5th International Conference on Text, Speech and Dialogue (TSD 2002). 139-146 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 木村文則, 前田亮, 吉川正俊, 植村俊亮: "ディレクトリ型検索エンジンを用いた言語横断情報検索"Forum on Information Technology 2002 (FIT). 第2分冊. 69-70 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] F.Sadat, A.Maeda, M.Yoshikawa, S.Uemura: "Exploiting and Combining Multiple Resources for Query Expansion in Cross-Language Information Retrieval"情報処理学会論文誌:データベース. SIG9(TOD15). 39-54 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] K.Hatano, H.Kinutani, M.Yoshikawa, S.Uemura: "Extraction of Partial XML Documents Using IR-based Structure and Contents Analysis"Conceptual Modeling for New Information Systems Technologies. 334-347 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 杉山一成, 波多野賢治, 吉川正俊, 植村俊亮: "On Some Methods for Improving Feature Vectors for Web Pages and their Retrieval Accuracy"電子情報通信学会第14回データ光学ワークショップ(DEWS2003). (Web上公開予定). (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 木村文則, 前田亮, 吉川正俊, 植村俊亮: "Webディレクトリの階層構造を利用した言語横断検索"電子情報通信学会第14回データ工学ワークショップ(DEWS2003). (Web上公開予定). (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] F.Sadat, M.Yoshikawa, S.Uemura: "Combining Multiple Knowledge Sources for an Efficient Query Expansion in Cross-Language Information Retrieval"Forum on Information Technology 2002 (FIT). 第2分冊. 67-68 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] F.Sadat, M.Yoshikawa, S.Uemura: "The Role of Query Expansion Techniques in French-English Information Retrieval"Journe'es Science and Technology Workshop 2002 (JST2002). (CD-ROM). (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] F.Sadat, M.Yoshikawa, S.Uemura: "Cross-Language Information Retrieval Using Multiple Resources and Combinations for Query Expansion"Second International Conference on Advances in Information Systems (ADVIS2002). 114-122 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] M.Yoshikawa, T.Amagasa, T.Shimura, S.Uemura: "XRel: A Path-Based Approach to Storage and Retrieval of XML Documents using Rela-tional Databases"ACM Transactions on Internet Technology. 1・1. 110-141 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 波多野 賢治, 渡邉 正裕, 吉川 正俊, 植村 俊亮: "情報検索技術を用いた部分文書構造の自動抽出"情報処理学会論文誌:データベース. 42・SIG8(TOD10). 38-46 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] F.Sadat, A.Meada, M.Yoshikawa, S.Uemura: "Cross-Language Information Retrieval Via Dictionary-based and Statistics-based Methods"Proc. of 2001 IEEE Pacific Rim Conference on Communications, Computers and Signal Processing(PACRIM'01). II. 595-598 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] F.Sadat, A.Maeda, M.Yoshikawa, S.Uemura: "Query Expansion Tehnique for the CLEF Bilingual Track"Working Notes for the CLEF 2001 Workshop. 99-104 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] D.D.Kha, M.Yoshikawa, S.Uemur: "An XML Indexing Structure with Relative Region Coordinate"Proc of the 17th IEEE International Conference on Data Engineering(ICDE2001). 313-320 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] T.Amagasa, M.Yoshikawa, S.Uemura: "Realizing Temporal XML Repositories using Temporal Relational Databases"The Third International Symposium on Cooperative Database Systems for Advanced Applications (CODAS'2001). 63-67 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] Masatoshi Yoshikawa: ""XML Databases", In Nontraditional Database Systems-Results from the Japanese Project on Advanced Database"The Information Processing Society of Japan and Taylor & Books Ltd. (2002)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 前田亮,関慶妍,吉川正俊,植村俊亮: "Web文書の符号系および使用言語の自動識別"電子情報通信学会論文誌D-II. J84・D-II. 115-130 (2001)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 前田亮,吉川正俊,植村俊亮: "前田亮,吉川正俊,植村俊亮"情報処理学会論文誌;データベース. 61・SIG6. 12-21 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Akira Maeda,Fatiha Sadat,Masatoshi Yoshikawa,and Shunsuke Uemura: "Query Term Disambiguation for Web Cross-Language Information Retrieval using a Search Engine"Proc.of the 5th International Workshop on Information Retrieval with Asian Languages(IRAL2000). 25-32 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Sadat Fatiha,Akira Maeda,Masatoshi Yoshikawa,and Shunsuke Uemura: "Integrating Dictionary-based and Statistical-based Approaches in Cross-Language Information Retrieval"情報処理学会データベースシステム研究会報告. DBS-121-1-10. (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 吉川正俊、志村壮是、植村俊亮: "オブジェクト関係データベースを用いたXML文書の格納と検索"情報処理学会論文誌:データベース. 40. 115-131 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] 前田 亮、関 慶妍、植村俊亮: "多言語知識発掘システムの構築"情報処理学会研究報告. 99-DBS-118/99-FI-54. 1-8 (199)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] 阪口哲男、中尾茂岳、前田 亮、杉本重雄、田畑孝一: "タグ付き文書を対象とした多言語全文検索システム"情報知識学会第7回研究報告会講演論文集. 49-52 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] Hachim Haddouti,Akira Maeda,Tetsuo Sakaguchi,Shigeo Sugimoto,and Koichi Tabata: "Towards Arabic Rendering Issuse-MHTML Approach"Proceedings of the Arabic Translation and Localisation Symposium (ATLA'99). (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] Akira Maeda and Shunsuke Uemura: "Key Technologies for Multilingual Information Processing WWW"Proceeding of the Fourth International Symposium on Standardization of Multilingual Information Technology (MLIT-4). (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] M.Yoshikawa,H.Kinutani,Y.Yamamoto,H.Kato and S.Uemura: "Advances in Databases and Multimedia for the New Century-A Swiss/Japanese Perspective-"World Scientfic Publishing. 140 (2000)

    • 関連する報告書
      1999 実績報告書

URL: 

公開日: 1999-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi