研究成果の概要 |
複数の学習済みCNNから得られる特徴を融合し,異なる画像認識タスクに転用する手法を開発した. まず,全結合層の重みの正規直交化により,CNNを学習したデータベースとは異なるタスクに特徴を転用した場合に性能が向上することを示した. この正規直交化した全結合層を画素へ局在化した特徴マップを2つのCNNから取得し, 双線形プーリングにより融合を行った. この融合特徴は, 最上位畳込層の特徴チャネルを融合するよりも少ない計算量で得られるが, それと同等以上の認識性能を示した. また, 対象タスクの学習データを用いて,畳み込み層の特徴を判別的に集積する方法を開発した.
|
研究成果の学術的意義や社会的意義 |
クラス代表ベクトルの正規直交化は, 対象タスクの学習データを利用せず学習済みのモデルのみから実行可能であるが, 全結合層の特徴をそのまま利用した場合よりも対象タスクでの認識性能が高く,最上位畳み込み層よりも出力される次元数が少ない特徴抽出を可能とする. これを特徴融合に利用することで,計算量が削減された高性能な融合特徴を抽出できる.また, 判別的特徴集積は,小サンプルデータにおいて高速に学習でき, CNNをファインチューニングするよりも有効であった. このように本研究成果は, 学習済みの巨大な深層学習のモデルを, 限られた計算資源で小サンプルデータ問題に適用する場合に有用である.
|