情報爆発時代の情報検索基盤技術

研究課題番号:18049069

2006年度 研究実績報告書

代表者

    • 安達 淳
    • 研究者番号:80143551
    • 国立情報学研究所・コンテンツ科学研究系・教授

研究課題基本情報

  • 研究期間

    2006年度〜2006年度

  • 研究分野

  • 審査区分

  • 研究種目

    特定領域研究

  • 研究機関

    国立情報学研究所

  • 配分額

    • 2006年度:16700千円 (直接経費:16700千円)
    • 2007年度:16800千円 (直接経費:16800千円)
    • 2008年度:16700千円 (直接経費:16700千円)
    • 2009年度:16100千円 (直接経費:16100千円)
    • 2010年度:16000千円 (直接経費:16000千円)

研究分担者

    • 大山 敬三
    • 研究者番号:90177022
    • 国立情報学研究所・コンテンツ科学研究系・教授
    • 高須 淳宏
    • 研究者番号:90216648
    • 国立情報学研究所・コンテンツ科学研究系・教授
    • 相澤 彰子
    • 研究者番号:90222447
    • 国立情報学研究所・コンテンツ科学研究系・教授

    • 江口 浩二
    • 研究者番号:50321576
    • 神戸大学・大学院・自然科学研究科・助教授
    • 井上 雅史
    • 研究者番号:50390597
    • 国立情報学研究所・コンテンツ科学研究系・助手

研究概要

本研究は、インターネット上で公開される各種テキストや個人・組織が管理する文書を対象として、関連する情報を結び付ける「情報リンケージ」プラットフォームの実現を目的とする。平成18年度は、情報リンケージプラットフォームの要素技術となる下記の研究に取り組んだ。

・多様な情報を扱うための統計モデルの研究

本研究は、関係データベースのような構造化されたデータおよび文書のような半構造データを対象としている。本年度は、半構造データのリンケージの基本技術として木構造を持ったデータのマッチングアルゴリズムおよびマッチングのための類似度関数の学習問題に取り組み、効率の良い学習/マッチングアルゴリズムを考案した。また、木構造の各ノードに割当てられた文字列の類似度を計算するための効率的なアルゴリズムを開発した。

・モノ検索およびリンケージモデルの研究

本年度は、効果的な情報を抽出するための特徴量の抽出問題に取り組んだ。まず、一般的な文書に対する検索のために、文書の背景にあるトピックを抽出することを試み、ベイズ学習の枠組みで抽出したトピックに基づいた文書の分類法を提案した。また、文書中に記述されているさまざまな意見を考慮した検索を実現するための、言語モデルを構築し、このモデルに基づいた意見情報検索法を提案した。さらに、文書中に現れる人物の同定問題に取り組み、Web上に存在するディレクトリを利用して、特定人物に関する情報をWebから検索する方法を考案した。

これらの要素技術に関する研究と並行して、大規模データベースを利用したエンティティの同定システムの構築を行い、学術文献や研究者を対象としたリンケージサーバを試作した。

発表文献

雑誌論文

  • Atsushi Matsumura, Atsuhiro Takasu, Jun Adachi: "Effect of Relationships betwee Words on Japanese Information Retrieval" ACM Transactions on Asian Language Information Processing 5・3. 264-289 (2006),

  • 若木 裕美, 正田 備也, 高須 淳宏, 安達 淳: "検索語の曖昧性解消のためのトピック指向単語抽出および単語クラスタリング" 情報処理学会論文誌データベース(TOD) 49・SIG19. 72-85 (2006)

  • Tatsuya Akutsu, Daiji Fukagawa, Atsuhiro Takasu: "Approximating tree edit distance through string edit distance" Proceedings of 17th International Symposium on Algorithms and Computation (ISAAC06). 90-99 (2006),

  • Hiromi Wakaki, Tomonari Masada, Takasu Atsuhiro, Jun Adachi: "A New Measure for Query Query Disambiguation using Term Co-occurrences" Proc. of 7th International Conference on Intelligent Data Engineeringand Automated Learning (IDEAL), Spain, Sep.20-23. 904-911 (2006),

  • Quang Minh Vu, Tomonari Masada, Atsuhiro Takasu, Jun Adachi: "Using a Knowledge Base to Disambiguate Personal Name in Web Search Results" SAC-IAR 2007. 185-191 (2007)

  • Masao Takaku, Keizo Oyama, Akiko Aizawa: "An Analysis on Topic Features and Difficulties based on Web Navigational Retrieval Experiments" Proc. Asia Information Retrieval Symposium (AIRS) 2006. 625-632 (2006),

このページのURI

http://kaken.nii.ac.jp/ja/p/18049069/2006/3/ja