多様な劣化水準に対応可能な劣化画像認識ネットワークに対するデータ拡張方法の研究

研究課題

研究課題/領域番号	22K21311
研究種目	研究活動スタート支援
配分区分	基金
審査区分	1002:人間情報学、応用情報学およびその関連分野
研究機関	帝京平成大学
研究代表者	遠藤和紀帝京平成大学, 人文社会学部, 准教授 (70963338)
研究期間 (年度)	2022-08-31 – 2025-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	2,860千円 (直接経費: 2,200千円、間接経費: 660千円) 2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
キーワード	劣化画像 / データ拡張 / 画像認識
研究開始時の研究の概要	自動運転車や監視カメラ等が撮像するデジタル画像は、一般にノイズや圧縮等の何らかの劣化が含まれる劣化画像であり、劣化画像の画質も多様である。そのため、多様な画質の劣化画像を認識できる畳み込みニューラルネットワークを構築することは、画像認識ネットワークを社会実装する上で重要である。本研究では、多様な画質の劣化画像を認識する畳み込みニューラルネットワークを学習する際に有効なデータ拡張方法を提案、構築する。
研究実績の概要	令和５年度は、前年度に開発した「多様な劣化水準（画像品質を制御するパラメータ）に対応可能な劣化画像の認識ネットワークの学習に有効なデータ拡張方法」の検証を行った。多様な劣化水準に対応するためには、ネットワークの学習時に、劣化のない画像と劣化のある画像を混在させ学習を実施するのが一般的である。今次研究では、劣化のない画像と劣化のある画像のそれぞれに適用するデータ拡張方法を異なるものにすることで、劣化画像の学習に特化したデータ拡張方法を提案した。具体的には、劣化のない画像にはRandom erasing（既存手法）を適用し、劣化のある画像にはCutBlur（既存手法）を適用した。当該手法を、４つの劣化（JPEG、Gaussian noise、Gaussian blur、ごま塩ノイズ）、３つのデータセット（CIFAR10、CIFAR100、TINY ImageNet）、４種類のネットワーク（VGG16、ResNet50、ResNet56、Shake PyramidNet）を用いて検証し、高画質の認識精度を維持しつつ、劣化画像の認識を行うことができるよう学習できることを実証した。しかしながら、低画質の認識精度がやや損なわれるという課題を残した。劣化画像認識に特化したデータ拡張方法に関する先行研究は少なく、今次提案手法は、劣化のある画像と劣化のない画像の認識性能を両立を検討する上で、重要な成果であると言える。なお、当該研究成果は、令和５年度末に、Journal of Electronic Imaging（オープンアクセス）に採録済みである。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由令和５年度末に雑誌論文として採録されており、本研究における当初目的は概ね達成されているため。
今後の研究の推進方策	当初計画の目的は概ね達成されているものの、研究実績の概要に記載した通り、低画質の認識精度がやや損なわれるという課題がある。令和６年度は、劣化のある画像をネットワークに入力することで抽出される画像特徴量に関する分析を行い、更なる知見の獲得を目指す。