2011 Fiscal Year Research-status Report
三次元物体検索のためのスケーラブルな次元圧縮技術とセグメンテーションの研究
Project/Area Number |
23500119
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
青野 雅樹 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (00372540)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | 情報検索 / セグメンテーション / 三次元形状 |
Research Abstract |
三次元物体データベースから、任意のクエリとなる三次元物体を与えて高性能に検索するために、我々は「多重フーリエスペクトル特徴量」(略称MFSD)を開発し、特許を保有している。このMFSD特徴量は、すべての物体を約3500次元の特徴量で表現するため、高次元の検索インデックスの保持が必要である。この問題を解決するために、インデックスのサイズを1/10に圧縮する非線形な次元削減である「線形化拡散写像法」を開発した。また、さらにスケーラブルな次元圧縮技術として、検索精度はある程度犠牲にするが、バーコードのようなバイナリ符号でハッシングを行う近似アルゴリズム「拡散ハッシング法」を開発した。この手法に関しては、査読付き国際会議で発表し、ベストペーパー賞にノミネートされた。一方、三次元物体全体でなく、部分的な検索を行うために必要なセグメンテーションの研究に関しては、「突起形状にもとづくセグメンテーション手法」(略称PBS法)を開発し、査読付き国際学会で採択され発表した。PBS法は、高性能なセグメンテーションを目指し、三次元物体を頂点と面の隣接性に基づきグラフを構成し、任意の2頂点間の距離を測地線距離として定義する。その後、物体の重心から測地線距離が最も遠い頂点を突起候補として選択し、ダイクストラのアルゴリズムを利用し、グラフの最短経路問題に置き換え、反復的に突起候補を探索する。その後、突起から各面までの距離ヒストグラムと、断面積ヒストグラムから、セグメンテーション境界を求めるという手法である。実験の結果、PBS法は、特に凹凸が多く複雑な形状の場合に有効であることを示した。また、三次元物体の検索で最も困難な問題であるクエリ入力に関して、三次元物体をユーザに用意させるのではなく、デジカメや携帯等で撮影された2次元画像から3次元物体を検索する手法を開発し、国内学会で報告した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
三次元物体の形状類似検索におけるスケーラブルな線形または非線形な次元削減手法の研究開発が第一目標であった。この目標に関しては、「スイスロール」のような非線形な多様体構造を保持したまま、線形化次元削減を行う手法を開発できた。しかも1/10にインデックスを圧縮したまま、検索精度は、圧縮しないMFSD手法とほぼ同等の精度を保つことができた。また、1/1000以上の圧縮技術に関しては、近似アルゴリズムであるが「拡散ハッシング法」を開発し、三次元形状類似検索で有名なベンチマークデータであるPrinceton Shape Benchmarkで256クラス(2の8乗クラス)に事前分類した。256クラスに分類するのに必要なのは8ビットであり、使用するデータの分類数に依存するが、1024クラスでも10ビットで実現でき、1/1000以上の圧縮を達成することができた。三次元物体全体でなく、部分的な検索を行うために必要なセグメンテーションの研究に関しては、こちらもPrinceton大学がデータとして用意した3D Segmentation Benchmarkデータを用いて19クラスあるクラスに関してベースラインのk-means法によるセグメンテーション、もっとも高性能であるとされるRandCuts法と呼ばれる従来手法と我々が開発したPBS手法を比較した。その結果、Cut Discrepancyというセグメンテーション境界の誤差の少なさの評価尺度において、Tableクラス、Plierクラスなど5つのクラスで提案手法が最高の精度を出すことが検証された。ただし、残りの14クラスのうち、13クラスは、RandCuts法がベストの結果を出しているので、今後の改良の余地を残している。このほか予定にはなかった2D画像からの3D検索のプロトタイプも実装できたので、だいたい予定通りの成果が出たと判断した。
|
Strategy for Future Research Activity |
スケーラブルな次元圧縮技術は、理論的には線形・非線形両方の圧縮技術のアプローチがあり、我々の開発した「線形化拡散写像法」は、非線形な多様体構造を保持したまま、低次元空間に圧縮できる点で、古典的な主成分分析や特異値分解、独立成分分析などの線形次元削減よりも精度的には、平均で上回ることを確認している。また、三次元物体だけでなく、特徴量空間が定義できさえすれば圧縮できるので、テキストや画像などパターン認識などへの応用が可能である。そこで、そのような応用の展開もひとつの視野に入れる予定である。一方、我々が開発した「多重フーリエスペクトル特徴量」(略称MFSD)も、最近の我々の内容の再吟味により、まだ検索精度の改良が可能であることを発見し、それによれば、現時点で我々が知る世界最高精度を達成できることが予備実験で確認できたため、MFSD特徴量自体の改良を次年度や視野に入れる予定である。また、部分的な検索を行うために必要なセグメンテーションの研究に関しては、まだ世界レベルのセグメンテーション精度を達成していないため、こちらは、より洗練されたモデル開発を行う予定である。具体的には、頂点と面のつながりをグラフで持たせた後、測地線距離をもとにAffinity Propagationによるクラスタリング、ならびにグラフ理論に基づくクラスタリングを適用する予定である。2D画像からの3D検索に関しても、より高性能な検索が出来る技術を開発予定である。
|
Expenditure Plans for the Next FY Research Funding |
|