不均質コンテンツに対する情報活用システムに関する研究

研究課題番号:13224087

2005年度 研究実績報告書

代表者

    • 安達 淳
    • 研究者番号:80143551
    • 国立情報学研究所・ソフトウェア研究系・教授

研究課題基本情報

  • 研究期間

    2005年度〜2005年度

  • 研究分野

  • 審査区分

  • 研究種目

    特定領域研究

  • 研究機関

    国立情報学研究所

  • 配分額

    • 2002年度:29200千円 (直接経費:29200千円)
    • 2003年度:27500千円 (直接経費:27500千円)
    • 2004年度:26400千円 (直接経費:26400千円)
    • 2005年度:28000千円 (直接経費:28000千円)

研究分担者

    • 相澤 彰子
    • 研究者番号:90222447
    • 国立情報学研究所・情報学資源研究センター・教授
    • 高須 淳宏
    • 研究者番号:90216648
    • 国立情報学研究所・実証研究センター・教授
    • 相原 健郎
    • 研究者番号:90300706
    • 国立情報学研究所・ソフトウェア研究系・教授

    • 片山 紀生
    • 研究者番号:60280559
    • 国立情報学研究所・情報メディア研究系・助教授
    • 井上 雅史
    • 研究者番号:50390597
    • 国立情報学研究所・実証研究センター・助手

研究概要

本研究では,インタネット上の情報資源は,生産・流通・利用・蓄積・他との関連・形態などあらゆる側面において従来のコンテンツとは根本的に異なる「不均質」なコンテンツであることに着目し,Webの構造に着目した解析と,不均質性に着目した新たな処理をモジュールとした研究体制をとってきた.

前者では,Webに代表される情報資源の構造上の特性を形式的にとらえ,それに適した新たな処理技術とモデルを提案することを目的としている.より具体的には,(1)リンク距離に基づくハイパーリンクによって構成されるWeb空間の潜在的構造の解析,(2)大規模,不均質,動的な特性に適したWebコンテンツのクラスタに基づくインデキシング,(3)時間情報に基づく重要語トラッキング,を中心に研究を進めた.

後者の不均質性に着目した処理では,(1)言語の不均質性,(2)ジャンル(コンテンツのタイプ)の不均質性に着目し,さらに,(3)画像,映像などを含むメディア横断の検索手法や学習環境への活用について研究を行った.言語の不均質性については,単に言語の差異を超えてあらゆる言語で書かれたコンテンツにアクセスするだけではなく,言語的不均質性に密接に相関することが多い,言語の背後にある文化や社会的状況の差異に由来する「視点」の差をも対象としている.コンテンツのジャンル(種類)の不均質性については,不均質性の分析を行うとともに,利用者の検索意図と求める情報のタイプに応じた複数文書の要約の自動作成について研究を行った.コンテンツの特性だけではなく,利用者の不均一性や状況(コンテクスト)を考慮した情報活用についても研究を進めた.

また,これらの処理手法を統合する情報活用システムの実現にはその有効性の評価が必要不可欠であり,評価実験用の大規模なテストベッドを構築し,評価手法についても研究を進めた.このモジュールでは,3回の国際ワークショップを開催した.

発表文献

雑誌論文

  • Lee, K-S., Kageura, K.: "Multilingual Story Link Detection based on Event Term Weighting on Timelines and Multilingual Spaces" Information Processing and Management (発行準備中詳細未定).

  • 相澤彰子, 大山敬三, 高須淳宏, 安達淳: "レコード同定問題に関する研究の課題と現状" 電子情報通信学会論文誌 VOL.J88-D1,No.3. 576-689 (2005),

  • 正田備也, 高須淳宏, 安達淳: "リンク情報の利用によるWeb検索性能の改善" 情報処理学会論文誌データベース Vol.46,SIG8(TOD26). 48-59 (2005)

  • Frederic C.Gey, Noriko Kando, Carol Peters: "Cross-language Information Retrieval : the Road Ahead" Information Processing and Management Vol.41,No.3. 415-431 (2005)

  • 関洋平, 江口浩二, 神門典子: "利用者の情報要求を考慮した観点に基づく複数文書要約とその評価" 情報処理学会論文誌データベース Vol.46,SIG8(TOD26). 106-119 (2005)

  • Makoto Iwayama, Atsuhi Fujii, Noriko Kando, Yuzo Marukawa: "An empirical study on retrieval models for different document genres : Patents and newspaper articles" Information Processing and Management Vol.42,No.1. 207-221 (2006)

  • Tsuneaki Kato, Jun'ichi Fukumoto, Fumito Masui, Noriko Kando: "Are Open-domain Question Answering Technologies Useful for Information Access Dialogues? An Empirical Study and a Proposal of a Novel Challenge" ACM Transactions of Asian Language Information Processing Vol.4,No.1(発行準備中詳細未定).

  • Kenro Aihara, Atsuhiro Takasu: "A Reciplocal Platform for Archiving Interview Videos about Arts and Crafts" the 5th ACM/IEEE Joint Conference on Digital Libraries,. 363 (2005)

図書

  • 影浦峡: ""図書館:印刷された紙の果てしなき繁茂",『図書館情報学の新しい地平』編集委員会,『図書館情報学の新しい地平』" 日本図書館協会(発行準備中詳細未定). (2005)

このページのURI

http://kaken.nii.ac.jp/ja/p/13224087/2005/3/ja