本研究では、高信頼性且つ高レベルビジョン段階の画像表現学習を行い、高精度な画像認識・理解をすることを目的とし、先端的画像理解システムの開発に関する研究を進めてきた。主な研究成果を以下の三点である。 (1)人間視覚認知プロセスに従って、ロー画像に視覚応答強度ドメインを変換し、全ての情報を保持したマイクロテクストンを抽出することで微小な構造差異も判別できる局所記述子を提案した; (2)混交ガウスモデルを用い、トレーニング記述子集合をフィッチングできるパラメータを学習し、テスト画像の記述子はそのモデルパラメータに対しての偏移統計量(低次と高次)を抽出することで、高信頼性な画像表現(中層:Middle-level表現)法を開発した; (3)Middle-levelな画像表現構造を積み重ねることで、深層フレームワークを発展させ、高信頼性且つ高レベルビジョンの画像表現フレームワークを構築した。これにより、理解精度を向上させ、異なる種類で微小な差異しか観測できない実用コンテンツの理解へ応用し、その有効性を検証した。 (4)提案された手法はそれぞれテクスチャ画像やバイオメディカル画像などの認識・理解への応用において、State-of-the-artの認識精度を得ることが確認できた。
|