不均質コンテンツに対する情報活用システムに関する研究

Research Project Number:13224087

FY2003 Annual Research Report

Principal Investigator

    • 安達 淳
    • Researcher Number:80143551
    • 国立情報学研究所・ソフトウェア研究系・教授

Basic Information of this Research Project

  • Project Year

    FY2003〜FY2003

  • Research Field

  • Screaning Classification

  • Research Category

    特定領域研究

  • Research Institution

    国立情報学研究所

  • Budget Amount

    • FY2002:¥29200000 (Direct:¥29200000)
    • FY2003:¥27500000 (Direct:¥27500000)
    • FY2004:¥26400000 (Direct:¥26400000)
    • FY2005:¥28000000 (Direct:¥28000000)

Co-Investigators

    • 片山 紀生
    • Researcher Number:60280559
    • 国立情報学研究所・情報メディア研究系・助教授
    • 影浦 峡
    • Researcher Number:00211152
    • 国立情報学研究所・人間・社会情報研究系・助教授
    • 相沢 彰子
    • Researcher Number:90222447
    • 国立情報学研究所・情報学資源研究センター・教授

    • 高須 淳宏
    • Researcher Number:90216648
    • 国立情報学研究所・実証研究センター・教授
    • 神門 典子
    • Researcher Number:80270445
    • 国立情報学研究所・ソフトウェア研究系・教授

Abstract

本研究は、今年度で3年目を終えた。研究全体は、インターネット上の情報資源の特質を総合的に捉えるために、大きく、4つのモジュールを定義して、相互に関係を維持しながら研究を進めている。すなわち、(1)Web構造解析とモデリング、(2)メディア処理・活用、(3)社会・利用分析、(4)不均質コンテンツ活用システム評価用テストベッドの構築、である。

本年度は、Webの構造に着目した解析としては、リンク距離に基づくハイパーリンクによって構成されるWeb空間の潜在的構造の解析手法と、大規模・不均質・動的な特性に適したWebコンテンツ間の動的モデル化に基づくクラスタリングについて手法の開発を進めた。

メディア処理・活用としては、多言語のニュース・イベント抽出・アラインメント手法の開発、ジャンルに基づく情報要約手法の開発、映像処理のためのデータベース技術の開発、Webに適した情報共有手法の開発を行った。社会・利用分析の観点からは、これまでのWebをめぐる多くの研究は、技術的な処理の側面からはWebの構造を反映した手法の展開に結びついている一方、情報活用のモデルはむしろ従来のメディア・イメージを反映していることを考慮し、印刷体のメディア活用モデルとWebのモデルとの構造的相違についてモデル化を進めた。

また、不均質コンテンツの活用手法の有効性を総合的に評価するための大規模なテストベッドの構築を進めてきている。これについては、テストベッドを用いた参加型の評価ワークショップの準備を進めており、2004年6月に国際ワークショップを開催する予定である。

Publications

  • 相沢 彰子: "低頻度語の利用によるテキストの分類性能の改善と評価"情報処理学会論文誌. 44・7. 1720-1730 (2003),

  • Koji Eguchi, Keizo Oyama, Emi Ishida, Noriko Kando, Kazuko Kuriyama: "Evaluation Methods for Web Retrieval Tasks Considering Hyperlink Structure"IEICE Transactions on Information and Systems. E86-D・9. 1804-1813 (2003),

  • 正田備也, 高須淳宏, 安達淳: "新しい連結性概念とWebページのグループ化への応用"日本データベース学会Letters. E86-D・1. 3-6 (2003),

  • 山田太造, 相原健郎, 高須淳宏, 安達淳: "peer-to-peerシステム上での評価の高いpeerの発見"日本データベース学会Letters. 2・1. 135-138 (2003),

  • Kyung-Soon Lee, Kyo Kageura, Key-Sun Choi.: "Implicit Ambiguity Resolution Based on Cluster Analysis in Cross-Language Information Retrieval"Information Processing & Management. 40・1. 145-159 (2004)

  • Taizo Yamada, Kenro Aihara, Atsuhiro Takasu, Jun Adachi: "A Distribute Index System for Efficient Query Processing in Peer-to-Peer Networks"IEEE Pacific Rim Conference on Cummunications, Computers and Signal Processing. 28-32 (2003)

  • Akiko Aizawa: "Analysis of Source Identified Text Corpora : Exploring the Statistics of the Reused Text and Authorship"41st Annual Meeting of the Association for Computational Linguistics (ACL-03). 383-390 (2003),

  • Yohei Seki, Koji Eguchi, Noriko Kando: "Analysis of Multi-Document Viewpoint Summarization Using Multi-Dimensional Genres"Exploring Attitude and Affect in Text : Theories and Applications, AAAI Spring Symposium 2004. (to appear). (2004)

  • Vicktoria L.Rubin, Noriko Kando, Elizabeth D.Liddy: "Certainty categorization model"In Proceedings of AAAI Spring Symposium on Exploring Attitude and Affect in Text : Theories and Applications, Stanford, CA, USA, March 2004. (to appear). (2004)

  • Makoto Iwayama, Atsushi Fujii, Noriko Kando, Yuzo Marukawa.: "An empirical study on retrieval models for different document genres : Patents and newspaper articles"In Proceedings of the 26th Annual International ACM-SIGIR, Conference on Research and Development in Information Retrieval (SIGIR 2003), July 28-Aug.1, 2003, Toronto, Canada. 251-258 (2003)

  • Koji Eguchi, Keizo Oyama, Emi Ishida, Noriko Kando, Kazuko Kuriyama: "System Evaluation Methods for Web Retrieval Tasks Considering Hyperlink Structure"The 12th International World Wide Web Conference (WWW2003). No.poster-344. (2003)

URI of this page

http://kaken.nii.ac.jp/en/p/13224087/2003/3/ja