2012 Fiscal Year Research-status Report
超高次元データの効率的な類似度検索を可能にする相補的P2P分散システムの開発
Project/Area Number |
24500072
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Tohoku University |
Principal Investigator |
菅谷 至寛 東北大学, 工学(系)研究科(研究院), 助教 (80323062)
|
Co-Investigator(Kenkyū-buntansha) |
大町 真一郎 東北大学, 工学(系)研究科(研究院), 教授 (30250856)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | オーバーレイネットワーク / 類似度検索 |
Research Abstract |
本研究では,Peer-to-Peerネットワーク技術を利用した広域分散システムにおいて,類似度検索をはじめとする柔軟な検索を効率的に行えるシステムを開発することを目的としている.コンテンツが低次元な特徴空間で表される場合,ZNetやSkipIndexのような多次元(ただし低次元のみ)での範囲検索が可能な構造化オーバーレイネットワークを類似度検索に利用できる.しかし,本研究で対象としている応用では,コンテンツは非常に多次元かつスパースであることが多く,これらの手法をそのまま利用することはできない. そこで,高次元でスパースな2値ベクトルを,特徴ベクトル間の距離関係をできるだけ保ったまま,比較的低次元の空間に変換することを考える.この変換によって,ZNetなどの範囲検索が可能な構造化オーバーレイネットワークを利用できるようになり,効率的な類似度検索を実現できると期待できる. 当該年度は,高次元特徴ベクトルを低次元空間に変換する方法のひとつとして,Counting Filterに着目した.Counting Filterによって高次元特徴ベクトルをいったん低次元ベクトルに変換してから,Z-orderingを用いてさらに1次元に変換し,SkipGraph上に配置する手法を実装した.一様およびクラスタ化された人工データ,「本棚.org」での実データなどを用いてコンピュータシミュレーションによる実験を行い,その基礎的な性質および性能の検証と検討を行った.また,比較のための基礎的な手法として,フラッディングによる類似度検索の性能や性質の調査も行った.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
高性能なワークステーションを2台調達して大規模な計算機シミュレーションを行う予定であったが,設置予定場所において十分な電力を確保できない見込みだったため,パソコンおよび現有設備による中規模なシミュレーション実験に変更した.そのため若干の遅れはあるが,中規模ではあるがシミュレーション実験自体は実施できており,研究計画全体への影響は軽微で回復可能である.なお,平成25年度は必要十分な電力が確保できる見込みである.
|
Strategy for Future Research Activity |
現在までに,特徴ベクトルを低次元空間に変換するための手法としてCounting Filterによる手法の検証を行ったが,今後はMDSやVivaldiなど,そのほかの手法についても検討を行っていく. さらに,「低次元空間に変換した上で範囲検索可能な構造化オーバーレイを用いる方法」だけではどうしても限界があると予想されるため,構造化オーバーレイと非構造化オーバーレイを組み合わせて用いることを検討していく.構造化オーバーレイによって大域的なデータ配置の最適化を行い,それを用いて局所的な自己組織化を担当する非構造化オーバーレイを構築する.
|
Expenditure Plans for the Next FY Research Funding |
次年度使用額は,当初計画していた大規模シミュレーション実験をパソコン及び現有設備による中規模シミュレーション実験に変更したことにより生じたものであり,次年度以降に実施するシミュレーション実験及びテストベッドでの実験と評価に必要な経費として,平成25年度請求額と合わせて使用する予定である.
|