令和4年度については、多様な劣化水準(画像品質を制御するパラメータ)に対応可能な劣化画像の認識ネットワークに有効なデータ拡張方法の開発を実施した。なお、令和5年度に、開発手法の検証を継続する。 交付申請書に記載した「1つの画像内に原画像や複数の劣化水準を含む領域を合成する方法」では、既存手法に対して顕著な認識精度の改善が見られなかった。そのため、申請書記載の手法や既存のデータ拡張方法が、どの劣化水準に関する劣化画像の認識精度を改善させるのかを実験的に調査した。その調査結果を踏まえ、当初想定とは異なる新たなデータ拡張方法を開発した。 新たに開発したデータ拡張方法は、現時点での検証結果を見る限り、次のような特性を有する。まず、原画像の認識精度については、原画像のみを学習した画像認識ネットワークと同水準の認識精度を示す。一方、高劣化の低画質画像については、劣化画像を既存手法であるmixed trainingにより学習した画像認識ネットワークよりも認識精度が低下する。なお、検証には、VGG16によるCIFAR10のクラス分類を行い、JPEG、Gaussian blur、Gaussian noise、Salt&pepper noiseの4種類の劣化を用いた。 高画質と低画質の認識精度の両立はやや損なわれてはいるものの、劣化画像認識に対するデータ拡張方法の先行研究は少なく、また原画像の認識精度を維持しつつ劣化画像にも対応できるデータ拡張方法は先行研究に見られないことから、今次研究結果は重要であるといえる。
|