画像認識のための深層学習モデルを作成するためには大規模な画像データセットが必要となるが、それぞれの画像認識課題に対して適切な大規模データセットを作成することが困難となる場面は多い。そこで、本研究課題では、小規模データセットを用いて学習を行った場合でも高い画像認識性能を達成する画像認識モデルの実現を目指した。具体的には、従来の画像認識モデルに対して新しく開発した Gate Module を導入することにより、従来と同じデータセットと同じ学習パラメータを用いて画像認識モデルを作成したとしても従来よりも高い画像認識性能を達成する仕組みを実現した。また、本研究課題で開発した画像認識モデルは転移学習においても高い性能を発揮するため、小規模の画像データセットに対しても従来よりも高い画像認識性能を実現している。 具体的には、既存の画像認識モデルである ConvNeXt や SwinTransformer に対して本研究課題で開発した Gate Module を導入した新しい画像認識モデルである SkipConvNext や SkipSwinTransformer を開発した。標準的な画像分類データセットである ImageNet を用いた画像分類タスクにおいて、新しく開発した画像認識モデルは従来手法よりも高い画像分類性能を達成することを検証した。また、標準的な物体検知データセットである MS-COCO や ADE20K を用いた画像認識タスクにおいて、新しく開発した画像認識モデルは従来手法よりも高い画像認識性能を達成しており、転移学習においても従来手法よりも高い画像認識性能を達成できることを検証した。
|