画像認識等においては、画像をベクトルとして表現する方式がよく用いられるが、このとき生成されるベクトルは一般に非常に高次元となるため、最近接探索等の基本操作に要する時間が大きくなるという問題がある。本研究の目的は、この高次元性に関わる難点を解消できるような、検索効率の観点から見て最適な画像表現方式及び高速探索アルゴリズムを確立すると共に、これらを3D物体認識等に利用することである。本年度の研究においては、与えられた画像データ(高次元ベクトル)の分布に応じて適応的に表現を選択し、データ検索を高速化するための研究を実施した。 N個のd次元ベクトルに対して最近接探索を行う場合、実行時間0(Nd)の単純なアルゴリズムがよく用いられる。このとき、ベクトルの次元を低減することができれば、この実行時間を改善することが可能になる。このための代表的な手法としては主成分分析(PCA)がよく知られている。PCAの場合、高次元データが低次元部分空間中に偏在している場合は有効であるが、一般には次元圧縮の効果があまり期待できない場合も多い。 しかしながら、データ全体は低次元部分空間中に偏在していなくても、もしデータをその分布状況に応じてクラスタリングでき、各クラスタが固有の低次元部分空間中に存在していれば、探索ベクトルに対してまずそれに近いクラスタを選択し、クラスタに固有の低次元座標系で検索を行うことで処理の高速化が期待できる。そこで、本研究においては与えられたデータの分布を解析し、これを標準的なEMアルゴリズムを用いて混合正規分布(Gaussian Mixture)としてモデル化し、検索ベクトルqが与えられたときの各Gaussian cの確率P(clq)に基づいてまずクラスタ(Gaussian)を選択してデータを限定し、さらに各Gaussianの共分散行列の主成分分析によって得られる圧縮後の次元で検索を行う手法を考案し、これを用いたプロトシステムを試作して能力評価を行った。
|