• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

情報爆発時代の情報検索基盤技術

Planned Research

Project AreaCyber Infrastructure for the Information-explosion Era
Project/Area Number 18049069
Research InstitutionNational Institute of Informatics

Principal Investigator

安達 淳  National Institute of Informatics, コンテンツ科学研究系, 教授 (80143551)

Co-Investigator(Kenkyū-buntansha) 大山 敬三  国立情報学研究所, コンテンツ科学研究系, 教授 (90177022)
高須 淳宏  国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
相澤 彰子  国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
井上 雅史  国立情報学研究所, コンテンツ科学研究系, 助教 (50390597)
Keywords情報検索 / 情報リンケージ / 大規模コーパス / テキスト処理 / 機械学習
Research Abstract

本研究は、インターネット上で公開される各種テキストや個人・組織が管理する文書を対象として、関連する情報を結び付ける「情報リンケージ」プラットフォームの実現を目的とする。平成19年度は、情報リンケージプラットフォームの要素技術となる下記の研究に取り組んだ。
1.データベースのレコードを軸としテキスト中に現れるエンティティと結びつける研究
フォーマットが指定されていないテキストをクエリとしてデータベース中の対応するレコードを検索する手法の研究を行った。特に大規模なデータベースに対して効率よく検索できる近似検索法を中心に研究を進めた。また、大規模な書誌データベースを用いて実験システムを試作し、その性能の評価を行った。
2.大規模ディレクトリを利用した人物リンケージ法の研究
実体を人物に限定し、特に同姓同名の人物を識別する手法の研究を行った。人物の同定精度をあげるために、その人物に関連するトピックに着目し、Web上に公開されているディレクトリを用いてトピックを人物について記述しているWebページからトピックを自動的に抽出方法を考案した。
2.半構造データリンケージのための順序木のマッチング研究
半構造データのリンケージを行うために、木構造データの近似マッチング法の研究を行った。木構造データの類似度を適応的にはかるための、統計的な近似モデルを提案し、訓練データからモデルのパラメタを推定する学習アルゴリズムを開発した。

  • Research Products

    (6 results)

All 2008 2007

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (4 results)

  • [Journal Article] 類語関係抽出タスクにおけるコーパス規模拡大の影響2008

    • Author(s)
      相澤彰子
    • Journal Title

      情報処理学会論文誌 49(掲載予定)

    • Peer Reviewed
  • [Journal Article] Using Web Directories for Similarity Measurement in Personal Name Disambiguation2008

    • Author(s)
      Quang Minh Vu, Atsuhiro Takasu, Jun Adachi
    • Journal Title

      Journal of Information Processing and Management (掲載予定)

    • Peer Reviewed
  • [Presentation] Data Allocation Scheme Based on Term Weight for P2P Information Retrieval2007

    • Author(s)
      Hisashi Kurasawa, Hiromi Wakaki, Atsuhiro Takasu, Jun Adachi
    • Organizer
      ACM International Workshop on Web Information and Data Management
    • Place of Presentation
      ポルトガル、リスボン
    • Year and Date
      20071100
  • [Presentation] Statistical Learning Algorithm for Tree Similarity2007

    • Author(s)
      Atsuhiro Takasu, Daiji Fukagawa, Tatsuya Akutsu
    • Organizer
      IEEE International Conference on Data Mining
    • Place of Presentation
      米国ネブラスカ州オマハ
    • Year and Date
      20071000
  • [Presentation] Mining Visual Knowledge for Multi-Lingual Image Retrieval2007

    • Author(s)
      Masashi Inoue
    • Organizer
      IEEE International Symposium on Data Mining and Information Retrieval
    • Place of Presentation
      カナダ、ナイヤガラフォールズ
    • Year and Date
      20070500
  • [Presentation] Using Web Directories for Similarity Measurement in Personal Name Disambiguation2007

    • Author(s)
      Quang Minh Vu, Tomonari Masada, Atsuhiro Takasu, Jun Adachi
    • Organizer
      IEEE International Symposium on Data Mining and Information Retrieval
    • Place of Presentation
      カナダ、ナイヤガラフォールズ
    • Year and Date
      20070500

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi