情報爆発時代の情報検索基盤技術

Research Project Number:18049069

Principal
Investigator(s)

  • FY2006 - FY2009

    • 安達 淳
    • Researcher Number:80143551
    • 国立情報学研・教授

Co-Investigators

    • 江口 浩二
    • Researcher Number:50321576
    • 神戸大学・大学院・自然科学研究科・助教授
    • 大山 敬三
    • Researcher Number:90177022
    • 国立情報学研究所・コンテンツ科学研究系・教授
    • 高須 淳宏
    • Researcher Number:90216648
    • 国立情報学研究所・コンテンツ科学研究系・教授

    • 相澤 彰子
    • Researcher Number:90222447
    • 国立情報学研究所・コンテンツ科学研究系・教授
    • 井上 雅史
    • Researcher Number:50390597
    • 国立情報学研究所・コンテンツ科学研究系・助教

Basic Information of this Research Project(Latest year)

  • Project Year

    2006~2009

  • Research Field

  • Screaning Classification

  • Research Category

    特定領域研究

  • Research Institution

    国立情報学研究所

  • Budget Amount

    • Total:¥66300000
    • FY2009:¥16100000 (Direct:¥16100000)
    • FY2008:¥16700000 (Direct:¥16700000)
    • FY2007:¥16800000 (Direct:¥16800000)
    • FY2006:¥16700000 (Direct:¥16700000)

Abstract(Latest report)

本研究は、インターネット上で公開される各種テキストや個人・組織が管理する文書を対象として、関連する情報を結び付ける「情報リンケージ」プラットフォームの実現を目的とする。平成19年度は、情報リンケージプラットフォームの要素技術となる下記の研究に取り組んだ。 1.データベースのレコードを軸としテキスト中に現れるエンティティと結びつける研究 フォーマットが指定されていないテキストをクエリとしてデータベース中の対応するレコードを検索する手法の研究を行った。特に大規模なデータベースに対して効率よく検索できる近似検索法を中心に研究を進めた。また、大規模な書誌データベースを用いて実験システムを試作し、その性能の評価を行った。 2.大規模ディレクトリを利用した人物リンケージ法の研究 実体を人物に限定し、特に同姓同名の人物を識別する手法の研究を行った。人物の同定精度をあげるために、その人物に関連するトピックに着目し、Web上に公開されているディレクトリを用いてトピックを人物について記述しているWebページからトピックを自動的に抽出方法を考案した。 2.半構造データリンケージのための順序木のマッチング研究 半構造データのリンケージを行うために、木構造データの近似マッチング法の研究を行った。木構造データの類似度を適応的にはかるための、統計的な近似モデルを提案し、訓練データからモデルのパラメタを推定する学習アルゴリズムを開発した。

URI of this page

http://kaken.nii.ac.jp/en/p/18049069