2008 Fiscal Year Annual Research Report
複雑ネットワークを利用した大規模高次元データの高速類似探索技術
Project/Area Number |
20500109
|
Research Institution | NTT Communication Science Laboratories |
Principal Investigator |
上田 修功 NTT Communication Science Laboratories, 企画担当, 主席研究員 (60379568)
|
Co-Investigator(Kenkyū-buntansha) |
斉藤 和巳 静岡県立大学, 経営情報学部, 教授 (80379544)
山田 武士 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主幹研究員 (50396115)
青山 一生 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主任研究員 (80447028)
|
Keywords | アルゴリズム / 機械学習 / ディレクトリ・情報検索 / 複雑ネットワーク / スモールワールド / 探索 / 索引構造 / 大規模データ |
Research Abstract |
【目的】大規模な高次元マルチメディアデータを対象とした超高速な類似探索技術を確立することが本研究の目的である。【本年度の研究実績】複雑ネットワークを用いた基本探索法に関し、特に、最良優先探索戦略に適したネットワーク構造を探求し有効性を検証するという課題に対して、次の結果を得た。無向k近傍グラフの各ノードの隣接ノードから貪欲戦略により当該ノードに到達可能なノード間の直接リンクの生成を抑制することにより平均次数を低減した次数低減近傍(k-DRNN)グラフが、最良優先探索戦略に適したネットワーク構造の1つであることを発見した。具体的には、大規模文書データ等の実データと人工データを用いて、k-DRNNグラフの構造評価と、このグラフ構造を索引構造とし最良優先探索戦略を適用した新たな探索法であるDR法の性能評価を行った。k-DRNNグラフは、類似オブジェクト同士がリンク結合しているにも係らず、平均最短パス長が小さいというスモールワールド特性を有する構造であることを確認した。また、DR法は非常に高速に類似データを発見することを確認した。次に、マルチメディアデータに対する基本探索方法の適用評価という課題に対して、文書データと類似の評価系を適用可能な画像データでの評価を試みた。インターネット上の画像データの収集及び利用可能な画像ライブラリーの取得により、探索用画像データベースの構築を行い、これらのデータにDR法を適用し性能を評価した。カラーヒストグラムやSIFT(Scale Invariant Feature Transform)に代表される様々な特徴を用いた画像データに関しても、DR法が有効であることを確認した。以上の結果より、新たに提案したDR法は、高速類似探索が可能であり、対象データに関する汎用性も高いと予想され、大規模マルチメディアデータの高速類似探索技術の基礎を成すと期待できる。
|