研究実績の概要 |
大規模なデータベースで学習された畳込ニューラルネット(CNN)の中間出力を他タスクへの特徴量として転用するCNN特徴転移は、学習元のタスクと適用タスクの性質が類似する場合に限り特に高い性能を発揮するため,学習データベースの選定が重要となる. 画像認識の認識対象は,複数の意味概念の集まりであるため、高精度な認識を実現するためには,従来のように単一のデータベースのみで学習されたCNN特徴を転用するのみでは不十分である. 本研究では, 複数の大規模データベースで学習されたCNNを融合し, 多様なタスクへ転用可能な汎用的な特徴抽出手法を探求する. 令和2年度では, これまでに開発したカメラ間の人物照合タスクにおける特徴集積法にランダム射影を用いた学習高速化の工夫を加えることで,性能を落とさずに学習速度を30倍程度の高速化に成功し, この成果を国際会議で発表した. また, 一般的な画像識別のデータベースにおいて,ImageNetとPlacesで学習済みの2つのCNNを連結させ,双線形プーリングにより融合させると認識精度が向上することを確認したが,その際2つの高次元特徴マップを連結させるために、特徴次元が増大し,計算量が高くなるという問題があった. これを解決するために,全結合層の重みベクトルを正規直交化したものを次元圧縮に用いることで,学習データを用いずとも高次元の特徴マップの次元削減を認識性能の低下が少なく行えること,これにより複数のCNNを融合した際の連結特徴の次元削減へ役立つことを確認した.
|