• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

情報爆発時代の情報検索基盤技術

計画研究

研究領域情報爆発時代に向けた新しいIT基盤技術の研究
研究課題/領域番号 18049069
研究機関国立情報学研究所

研究代表者

安達 淳  国立情報学研究所, コンテンツ科学研究系, 教授 (80143551)

研究分担者 大山 敬三  国立情報学研究所, コンテンツ科学研究系, 教授 (90177022)
キーワード情報検索 / 情報リンケージ / 大規模コーパス / テキスト処理 / 機械学習
研究概要

本研究は、インターネット上で公開される各種テキストや個人・組織が管理する文書を対象として、関連する情報を結び付ける「情報リンケージ」プラットフォームの実現を目的とする。平成22年度は、情報リンケージプラットフォームの要素技術となる下記の研究に取り組んだ。
1.類似検索索引の研究
大量の情報の中から類似するデータを高速に見つけ出すことを目的とした、類似検索索引と近傍ペア探索アルゴリズムの開発に取り組んだ。本研究は適応型空間多分割による分割統治法のk最近傍ペア探索手法、Adaptive Multi Partitioning(AMP)を提案した。AMPはPivotからオブジェクトまでの距離が分散している空間から順に分割・統治のステップでk最近傍ペアを探索する。距離に対するオブジェクトの分散は、距離の分布の歪度をもとに判断する。本手法は、距離に対するオブジェクトの分布が密な空間のほうが、収束した上限値による枝刈りの効果が大きいことを利用しており、実験的にその効果を示した。
2.高速な木類似度計算手法の開発
昨年度に引き続き、木の類似度を高速に計算するアルゴリズムの研究を行った。今年度はNP困難な問題である無順序木の編集距離を、距離がk以下の場合に、多項式時間で計算するfix parameterアルゴリズムを開発した。構築したアルゴリズムは動的計画法に基づくもので、パラメタK、木の大きさnに対して上記の制約のもとで多項式時間で計算可能なことを示した。
3.情報リンケージシステムの構築と実証
昨年度に引き続き情報リンケージシステムの構築と実証実験を行った。昨年度までに大規模な書誌および著者情報の統合のためのリンケージサーバは構築してきたが、本年度はこのサーバに改良を加えるとともに、リンケージされた学術情報を能動的に利用者に提示する論文推薦システムについての検討を行った。このシステムの一部を実装し、その有効性の検証を行っている。

  • 研究成果

    (11件)

すべて 2011 2010

すべて 雑誌論文 (6件) (うち査読あり 6件) 学会発表 (5件)

  • [雑誌論文] Exact Algorithms for Computing Tree Edit Distance between Unordered Trees2011

    • 著者名/発表者名
      Tatsuya Akutsu, Daiji Fukagawa, Atsuhiro Takasu, Takeyuki Tamura
    • 雑誌名

      Theoretical Computer Science

      巻: 412 ページ: 352-364

    • 査読あり
  • [雑誌論文] Finding the k-Closest Pairs in Metric Spaces2011

    • 著者名/発表者名
      Hisashi Kurasawa, Atsuhiro Takasu, Jun Adachi
    • 雑誌名

      In Proceeding of 1st International Workshop on New Trends in Similarity Search (NTSS 2011)

      ページ: 8-13

    • 査読あり
  • [雑誌論文] Optimal Pivot Selection Method based on the Partition and the Pruning Effect for Metric Space Indexes2010

    • 著者名/発表者名
      Hisashi Kurasawa, Daiji Fukagawa, Atsuhiro Takasu, Jun Adachi
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E94-D ページ: 504-514

    • 査読あり
  • [雑誌論文] Margin-based Pivot Selection for Similarity Search Indexes2010

    • 著者名/発表者名
      Hisashi Kurasawa, Daiji Fukagawa, Atsuhiro Takasu, Jun Adachi
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E93-D ページ: 1422-1432

    • 査読あり
  • [雑誌論文] Pivot Selection Method for Optimizing both Pruning and Balancing in Metric Space Indexes2010

    • 著者名/発表者名
      Hisashi Kurasawa, Daiji Fukagawa, Atsuhiro Takasu, Jun Adachi
    • 雑誌名

      In Proceeding of 21th International Conference on Database and Expert Systems Applications (DEXA 2010)

      ページ: 141-148

    • 査読あり
  • [雑誌論文] Language Model Combination for Community-based Q&A Retrieval2010

    • 著者名/発表者名
      Akira Takahashi, Atsuhiro Takasu, Jun Adachi
    • 雑誌名

      In Proceedings of 22th International Conference on Tools with Artificial Intelligence (ICTAI 2010)

      巻: E92-D ページ: 241-248

    • 査読あり
  • [学会発表] メトリック空間における最近傍ペア探索アルゴリズムの高速化2011

    • 著者名/発表者名
      倉沢央, 高須淳宏, 安達淳
    • 学会等名
      情報処理学会全国大会論文集,4B-1
    • 発表場所
      東京工業大学大岡山キャンパス
    • 年月日
      2011-03-03
  • [学会発表] 距離尺度の組み合わせによるTop-k検索の提案2011

    • 著者名/発表者名
      鈴木貴敦, 高須淳宏, 安達淳
    • 学会等名
      情報処理学会全国大会論文集,4N-7
    • 発表場所
      東京工業大学大岡山キャンパス
    • 年月日
      2011-03-03
  • [学会発表] メモリ上の全文検索システムのためのデータ構造と処理の効率化2011

    • 著者名/発表者名
      渡辺健太郎, 高須淳宏, 安達淳
    • 学会等名
      情報処理学会全国大会論文集,2P-9
    • 発表場所
      東京工業大学大岡山キャンパス
    • 年月日
      2011-03-02
  • [学会発表] Suffix Arrayによる可変長N-gramを用いた類似文字列検索2011

    • 著者名/発表者名
      木村光樹, 高須淳宏, 安達淳
    • 学会等名
      情報処理学会全国大会論文集,2P-8
    • 発表場所
      東京工業大学大岡山キャンパス
    • 年月日
      2011-03-02
  • [学会発表] 類似検索の高速化を目的としたPivot選択手法の実験評価2010

    • 著者名/発表者名
      倉沢央, 深川大路, 高須淳宏, 安達淳
    • 学会等名
      第9回情報科学技術フォーラム(FIT2010)論文集,D-008
    • 発表場所
      九州大学伊都キャンパス
    • 年月日
      2010-09-07

URL: 

公開日: 2013-06-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi