本研究課題は深層学習を用いた弱教師あり学習による画像に対する物体位置推定である。深層学習における教師情報のコスト削減についての研究は近年注目を集めているが、本研究課題は特に領域分割における教師情報の削減方法についての研究を行っている。領域分割はComputer Visionにおいて長く研究されてきた重要なテーマであり、他のCV分野のタスクと比較して深層学習における教師情報のコストが高くこれのコスト削減が可能となれば大きな利益になると期待できる。 本研究ではこれを達成するために、弱教師あり領域分割に着目をおき研究を行った。弱教師あり領域分割はクラスラベルから領域分割を学習するアプローチである。クラスラベルは画像に映っている対象物体のタグ情報のことである。これはピクセルレベルのアノテーションと比較してコストが安価であるため、これを用いて領域分割モデルが学習できれば大きな学習コスト削減となる。本研究においては弱教師あり領域分割の問題を教師情報となる擬似領域分割ラベルの精度向上、ひいては擬似領域分割ラベルのノイズ除去問題であると置き換えて考えた。そして、以下の二つのアプローチについて検証を行った。 (1)領域分割の容易性の推定値を使った画像レベルのノイズ除去による精度向上 (2)自己教師あり学習による変化領域の推論を活用した領域レベルのノイズ除去による精度向上 特に、自己教師あり学習による変化領域の推論を活用した領域レベルのノイズ除去による精度向上の研究においては、現在の弱教師あり領域分割のベンチマークにおける最高精度を達成した。この研究成果はComputer Vision分野におけるトップカンファレンスであるICCV 2019(Acceptance rate 25%)に採択され、弱教師あり領域分割の進歩に貢献したと判断できる。
|