画像セグメンテーションとは,画像を物体などのまとまりごとに分割するタスクであり,画像処理における重要な課題の一つである.従来の手法では,人間が色やテクスチャを表す画像特徴量を定義し,その類似度に基づいて領域を分割する方法が一般的であった.これに対して,近年の深層学習を利用した手法では,車や人,道路など意味的にまとまった画像領域を分割し,ラベルを付与するセマンティックセグメンテーションが可能になってきた.ただし,深層学習には大量の教師データが必要であるため,本研究では教師データを必要としない教師なし深層学習による画像セグメンテーションを開発することを目的としている. 昨年度と一昨年度は,これを実現するための微分可能クラスタリングという基盤技術を提案し,理論を確立するとともに,様々なデータセットで有効性を評価した.提案手法は入力画像に対し,特徴抽出モジュールと画素クラスタリングモジュールをEnd-to-Endに学習することで,双方を最適化する.さらに,二次元画像だけでなく動画像データのセグメンテーションへ応用し,様々なアプリケーションへと発展させた.さらに「教師なし画像セグメンテーションのベーシックな手法と深層学習ベースの手法の紹介」という論文タイトルで,日本医用画像工学会(JAMIT)誌「MEDICAL IMAGING TECHNOLOGY 39(4)」の特集論文を寄稿した他,第15回IEEE Signal Processing Society (SPS) Japan Student Journal Paper Awardを受賞した.最終年度はセグメンテーション画像を入力とした画像のシーン識別手法を開発し,コンピュータビジョン分野における国内最大規模の会議であるMIRU2022にて発表した.また,大量のセグメンテーション画像を効率的に圧縮保存する手法の検討・開発を行った.
|