研究課題/領域番号 |
20500109
|
研究機関 | 日本電信電話株式会社NTTコミュニケーション科学基礎研究所 |
研究代表者 |
上田 修功 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 企画担当, 主席研究員 (60379568)
|
研究分担者 |
斉藤 和巳 静岡県立大学, 経営情報学部, 教授 (80379544)
澤田 宏 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主幹研究員 (10396210)
青山 一生 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主任研究員 (80447028)
|
キーワード | アルゴリズム / 機械学習 / ディレクトリ / 複雑ネットワーク / スモールワールド / 探索問題 / 索引構造 / 大規模データ |
研究概要 |
【目的と手段】本研究は、大規模高次元マルチメディアデータを対象とした超高速な類似探索技術を確立することを目的とする。目的達成手段として、スモールワールド特性を有するネットワーク(グラフ)を索引構造に適用する。 【本年度の研究実績】第1に、探索効率の向上を目的とした新たな索引構造の提案、有効性の確認という課題に関し、次の結果を得た。無向近傍グラフの辺集合の部分集合に対しランダム張替えを行い、近傍に加え長距離点間にも辺を設けたグラフを索引構造とし、当該グラフ上を最良優先探索により探索する方法を、文書データに適用し評価した。当該部分集合のサイズを0から増加させた結果、探索コスト期待値は単調に増加した。高速探索のためには、索引となるグラフが、平均最短パス長が小さいという構造的スモールワールド(SW)特性を有することのみならず、類似の点が結合されているというホモフィリィ、点の属性に関するSW特性も重要であることを確認した。第2に、基本探索法(DR法:索引構造である次数低減無向近傍グラフ上を最良優先探索による探索する方法)の音声信号データに対する適用評価という課題に関して、次の結果を得た。発話データから抽出された特徴ベクトル集合を用いて推定したガウス混合モデルをオブジェクトとする集合を被探索集合とし、オブジェクト間の非類似度としてカルバック・ライブラー・ダイバージェンスを用いた非距離モデル空間にDR法を適用し評価した。結果、DR法は既存グラフ探索法に比べ、低探索コストで高探索成功率を達成した。以上、我々の提案するDR法が、距離空間・非距離空間を効率的に類似探索することを確認できた。また、本探索法の非距離モデル空間探索の結果より、音声音響信号データや異種複合データから推定された任意のモデルを対象とした探索における新たな研究分野の創出を期待できる。
|