研究課題/領域番号 |
20500109
|
研究機関 | 日本電信電話株式会社NTTコミュニケーション科学基礎研究所 |
研究代表者 |
上田 修功 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 日本電信電話株式会社・NTTコミュニケーション科学基礎研究所, 所長 (60379568)
|
研究分担者 |
斉藤 和巳 静岡県立大学, 経営情報学部, 教授 (80379544)
澤田 宏 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主幹研究員 (10396210)
青山 一生 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主任研究員 (80447028)
|
キーワード | アルゴリズム / 機械学習 / ディレクトリ / 複雑ネットワーク / スモールワールド / 探索問題 / 索引構造 / 大規模データ |
研究概要 |
【目的と手段】本研究は、大規模高次元マルチメディアデータを対象とした超高速な類似探索技術を確立することを目的とする。スモールワールド特性を有するグラフを索引構造に適用することを手段とする。【本年度の研究実績】主に、基本探索法の提案評価という課題に取り組んだ。1。低次元データ用索引構造として既知の相対近傍グラフ(RNG)の高次元データへの適用可能性の有無を、グラフ構造を特徴付ける平均次数、平均最短パス長に着目し、実験的に調べた。結果、一般的に高次元データ特性を示す文書データから構築されたRNGは、10次元程度のユークリッド空間における一様ランダムデータから構築されたものと類似の構造的特徴を示すことを確認した。RNGは高次元データ探索の索引構造として期待できる。2.類似探索性能に影響するグラフ構造の新たな指標として、(1)あるクエリに対し貪欲探索を実行した場合、探索が停止する頂点の数である停留点数、(2)あるクエリへ貪欲探索により到達可能な頂点集合であるベイズン、(3)ある頂点から貪欲探索により到達可能である頂点数、を提案し、RNGとk近傍グラフとを対象に評価した。以上、RNGが高次元データを対象とした類似探索の索引構造として有用である可能性を示し、類似探索性能に影響するグラフ構造に関する指標を提案した。新たに提案した指標は、より効率的なグラフ索引構造の発見や類似探索の精度保証法の開発に貢献すると期待できる。
|