三次元形状モデルの多重フーリエスペクトルで得られた4つの特徴量で得られるMFSD (Multiple Fourier Spectral Descriptor)にスペクトルクラスタリングを行い検索性能の向上を目指した論文は、投稿後、スプリンガー社の国際論文誌から出版された。 一方、MFSD特徴量ベクトルの新しい次元削減手法を開発した。これは、非線形な次元削減手法の問題点であった、未知データへの学習の難しさを克服するための線形化手法である。具体的には、拡散写像法という多様体学習基づく非線形な次元削減に、スペクトル回帰を応用した線形化手法を開発し、実装を行った。この手法には性能を調整可能なパラメータをもたせられる。通常、次元削減すると情報の損失を伴うが、パラメータの調整により、検索性能が向上できるという点で秀逸な技術であることが判明した。実際、この新しい線形化次元削減手法により、元々3000次元以上の高次元の特徴量であった三次元形状モデルに適用したところ、検索精度を5%程度向上でき、同時に3次元数を2ケタくらい圧縮することが出来た。この手法のもうひとつの重要な点は、メディアに関係なく適用できる点である。実際、三次元形状モデル以外にも、手書き文字認識のベンチマークデータや、テキストデータを使った文書分類などでも、性能向上を達成できた。文書分類事例として、「20-Newsgroup」ベンチマークのテキストデータで事前学習し、パラメータを調整した後、文書分類を行い、次元削減しない方法、および類似する他手法との比較実験を行ったところ、この手法の性能が最高だった。このように、これまで三次元形状モデルの検索を中心に開発してきたが、分類に代表される知識統合処理において、開発した手法が画像や文書などマルチメディアでの有効性を検証できた。
|