情報爆発時代の情報検索基盤技術

研究課題番号:18049069

2007年度 研究実績報告書

代表者

    • 安達 淳
    • 研究者番号:80143551
    • 国立情報学研究所・コンテンツ科学研究系・教授

研究課題基本情報

  • 研究期間

    2007年度〜2007年度

  • 研究分野

  • 審査区分

  • 研究種目

    特定領域研究

  • 研究機関

    国立情報学研究所

  • 配分額

    • 2006年度:16700千円 (直接経費:16700千円)
    • 2007年度:16800千円 (直接経費:16800千円)
    • 2008年度:16700千円 (直接経費:16700千円)
    • 2009年度:16100千円 (直接経費:16100千円)
    • 2010年度:16000千円 (直接経費:16000千円)

研究分担者

    • 大山 敬三
    • 研究者番号:90177022
    • 国立情報学研究所・コンテンツ科学研究系・教授
    • 高須 淳宏
    • 研究者番号:90216648
    • 国立情報学研究所・コンテンツ科学研究系・教授
    • 相澤 彰子
    • 研究者番号:90222447
    • 国立情報学研究所・コンテンツ科学研究系・教授

    • 井上 雅史
    • 研究者番号:50390597
    • 国立情報学研究所・コンテンツ科学研究系・助教

研究概要

本研究は、インターネット上で公開される各種テキストや個人・組織が管理する文書を対象として、関連する情報を結び付ける「情報リンケージ」プラットフォームの実現を目的とする。平成19年度は、情報リンケージプラットフォームの要素技術となる下記の研究に取り組んだ。

1.データベースのレコードを軸としテキスト中に現れるエンティティと結びつける研究

フォーマットが指定されていないテキストをクエリとしてデータベース中の対応するレコードを検索する手法の研究を行った。特に大規模なデータベースに対して効率よく検索できる近似検索法を中心に研究を進めた。また、大規模な書誌データベースを用いて実験システムを試作し、その性能の評価を行った。

2.大規模ディレクトリを利用した人物リンケージ法の研究

実体を人物に限定し、特に同姓同名の人物を識別する手法の研究を行った。人物の同定精度をあげるために、その人物に関連するトピックに着目し、Web上に公開されているディレクトリを用いてトピックを人物について記述しているWebページからトピックを自動的に抽出方法を考案した。

2.半構造データリンケージのための順序木のマッチング研究

半構造データのリンケージを行うために、木構造データの近似マッチング法の研究を行った。木構造データの類似度を適応的にはかるための、統計的な近似モデルを提案し、訓練データからモデルのパラメタを推定する学習アルゴリズムを開発した。

発表文献

雑誌論文

  • 相澤彰子: "類語関係抽出タスクにおけるコーパス規模拡大の影響" 情報処理学会論文誌 49(掲載予定). (2008), 1

  • Quang Minh Vu, Atsuhiro Takasu, Jun Adachi: "Using Web Directories for Similarity Measurement in Personal Name Disambiguation" Journal of Information Processing and Management (掲載予定). (2008), 1

学会発表

  • Masashi Inoue: "Mining Visual Knowledge for Multi-Lingual Image Retrieval" IEEE International Symposium on Data Mining and Information Retrieval. (20070500). カナダ、ナイヤガラフォールズ

  • Quang Minh Vu, Tomonari Masada, Atsuhiro Takasu, Jun Adachi: "Using Web Directories for Similarity Measurement in Personal Name Disambiguation" IEEE International Symposium on Data Mining and Information Retrieval. (20070500). カナダ、ナイヤガラフォールズ

  • Atsuhiro Takasu, Daiji Fukagawa, Tatsuya Akutsu: "Statistical Learning Algorithm for Tree Similarity" IEEE International Conference on Data Mining. (20071000). 米国ネブラスカ州オマハ

  • Hisashi Kurasawa, Hiromi Wakaki, Atsuhiro Takasu, Jun Adachi: "Data Allocation Scheme Based on Term Weight for P2P Information Retrieval" ACM International Workshop on Web Information and Data Management. (20071100). ポルトガル、リスボン

このページのURI

http://kaken.nii.ac.jp/ja/p/18049069/2007/3/ja