研究実績の概要 |
写真や動画を撮影する際,窓・ガラス等からの反射により,画像のノイズの原因となる反射光が度々発生する.この反射光は単に,画質を悪くするだけでなく,物体検出・セグメンテーション等のコンピュータビジョンタスクにも悪影響を与える.そこで,単一画像を用いた映り込み除去(Single Image Reflection Removal: SIRR)を行うことで,画像認識等のコンピュータビジョンタスクのロバスト性の向上が期待できる.SIRRでは,ルールベースと深層学習モデルを採用したモデルが主流であり,学習時に線形性を付加した合成データを用いることが多い.しかし,現実世界で学習データの真値を得ることが困難なため,学習データが少ない点は実応用において致命的な限界を露出している.そこで本研究では,メタ学習等の先端的な深層学習モデルを用いたSIRRを提案する予定だった. 今年度では基盤研究となる少量の異常データでも高精度な異常検知を可能にする手法の開発を行った.少量の異常データに対してデータ拡張を行い, 拡張したデータセットを事前学習済みのSwin Transformerで転移学習することで, 少量の異常データでも高精度な異常検知を可能にした. また, Grad-CAMを用いて画像分類の判断根拠を可視化することで, 異常部位に正しく注目できているか確かめた.本実験結果により, 汎用性の高い映り込み除去法の提案が可能となった.
|
今後の研究の推進方策 |
今後は高速なメタ学習モデルだけではなく,Swin Transformer等の深層学習モデルも汎化性能の高い映り込み除去法が可能となる.そこで,本研究では, 画像分類モデルにSwin Transformerを用いて, また, 少数のデータで効率よく学習させるために, ImageNetで事前学習済みの本モデルで転移学習を行うよていである.
|