本研究では、画像を高速かつ高精度で認識するため、外部環境からの影響が受けにくい局所的な特徴を抽出し、統合するため従来のBoFでの量子化ではなく一つのテンソルとして取り扱い、統一的に効率よく記述する枠組を開発した。テンソルになる大量な局所特徴を融合するため多次元教師付き部分空間法を提案し、シーン、物体等への認識応用において大幅な精度の向上を検証した。また画像からhand-craftな局所特徴(SIFTなど)を抽出するだけではなく、簡単且つ効率に得られるraw特徴(色輝度値、勾配など)に対して、データ駆動モデル(k-means、GMM)を用いて解析し、より高速且つ効率的な画像記述法を開発した。
|