2013 Fiscal Year Research-status Report
超高次元データの効率的な類似度検索を可能にする相補的P2P分散システムの開発
Project/Area Number |
24500072
|
Research Institution | Tohoku University |
Principal Investigator |
菅谷 至寛 東北大学, 工学(系)研究科(研究院), 助教 (80323062)
|
Co-Investigator(Kenkyū-buntansha) |
大町 真一郎 東北大学, 工学(系)研究科(研究院), 教授 (30250856)
|
Keywords | オーバーレイネットワーク / 類似度検索 |
Research Abstract |
本研究では,Peer-to-Peerネットワーク技術を利用した分散システムにおいて,類似度検索をはじめとする柔軟な検索を効率的に行えるシステムを開発することを目的としている.対象とするデータが低次元ベクトルで表される場合,ZNetやSkipIndexのような範囲検索が可能な構造化オーバーレイネットワークを類似度検索に利用することができる.しかし本研究で対象としている応用では,コンテンツは非常に高次元かつスパースであるため,これらの手法をそのまま利用することができない. そこで,高次元でスパースな特徴ベクトルを,それらの間の距離関係をできるだけ保存したまま,低次元空間に圧縮することを考える.この変換により,範囲検索が可能な構造化オーバレイを使用した類似度検索が可能になると考えられる. 前年度は,高次元特徴ベクトルを低次元空間に変換する方法としてCounting Filterに着目して検討を行ったが,当該年度では,ネットワーク座標系Vivaldiを利用した手法を検討した.Vivaldiはコンピュータネットワークにおいてノード間のRTTを距離と考え,その距離を反映した仮想座標にノードを埋め込む手法であるが,これを高次元特徴ベクトルの次元圧縮に応用した.Counting Filterによる手法とVivaldiによる手法を比較検討し,Vivaldiによる手法の方が検索効率が良いことを確認した. さらに,「低次元空間に変換した上で範囲検索可能な構造化オーバーレイを用いる方法」だけでは限界があると予想されるため,非構造化オーバーレイを用いた手法についても検討を開始した.非構造化オーバーレイでの検索ではフラッディングをベースとするが,検索のキャッシュ及びデータの移動によって,クエリ到達ピア数およびメッセージ数を押さえられることを実験により確認した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では,分散環境における高次元特徴ベクトルの効率的な類似度検索を実現するために,「構造化オーバーレイに基づく手法」と「非構造化オーバーレイに基づく手法」の両方を検討し,組み合わせて使用することを計画している. 当該年度までに「構造化オーバーレイに基づく手法」と「非構造化オーバーレイに基づく手法」のそれぞれについて検討を行っており,おおむね順調に進展していると考えられる.
|
Strategy for Future Research Activity |
現在までに「構造化オーバーレイに基づく手法」と「非構造化オーバーレイに基づく手法」のそれぞれについて検討を行ったが,それらを組み合わせる手法について研究を行っていく.構造化オーバーレイによって大域的なデータ配置の最適化を行い,それを用いて局所的な自己組織化を担当する非構造化オーバーレイを構築することを意図している. また,「構造化オーバーレイに基づく手法」において,Counting FilterよりもVivaldiの方が検索効率が良いことを確認しているが,現在のところ,Vivaldiによる手法はメッセージ数が多いと考えられる.そのため,メッセージ数の削減に関しても検討を行う.
|
Expenditure Plans for the Next FY Research Funding |
次年度使用額は,今年度の研究を効率的に推進したことに伴い発生した未使用額である. 平成26年度請求額と合わせ,平成26年度の研究遂行のために使用する予定である.
|