2023 年度実施状況報告書

深層生成モデルの潜在空間の探索からの異常パターンの生成と理解

研究課題

研究課題/領域番号	22K17912
研究機関	広島大学
研究代表者	相澤宏旭広島大学, 先進理工系科学研究科(工), 助教 (30910301)
研究期間 (年度)	2022-04-01 – 2025-03-31
キーワード	生成モデル
研究実績の概要	2023年度では、『画像生成モデルの学習と応用』および『利用する大規模生成モデルの調査』を主要な研究課題として、画像生成モデルに関する研究を引き続き行なった。前述の課題について、画像生成モデルの生成モデルを調査するために、画像中に欠落領域をもっともらしく補完するInpaintingタスクのための画像生成モデルについて検討した。具体的には、欠落領域が大きくなるほど画像生成モデルの補完は難しいという課題に対して、粗い生成から詳細な生成を行う二段階の画像生成の枠組みを提案し、従来手法を上回る結果を達成した。結果は、異常パターンの生成において、画像生成モデルを利用した場合、異常パターンの生成のためのモデルの構造や生成方法について示唆を与えるものであり、昨年度の結果とともに、これに基づいて、異常パターンを生成するための枠組みの構築に向けた取り組みを進めていく予定である。また昨年度同様に拡散モデルに関する検討も行なっている。加えて、本研究課題の遂行期間中に、ChatGPTをはじめとする大規模言語モデルの登場により、言語による画像の認識と生成の制御が大きく進んだ。今後は画像単体からの生成モデルの構築だけでなく、特に、言語と組み合わせた画像生成モデルや異常検知方法の検討を進める必要がある。
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由 2023年度では、本研究課題のキーアイデアである画像生成モデルのモデル構造に関する検討を達成した。ただし、異常検知タスクでの生成モデルの評価については、拡散モデルと大規模言語モデルの登場により、検討モデルの調査・実装を行なっているため遅れが生じている。
今後の研究の推進方策	３年目については、当初予定していたStyleGANなどの敵対的生成モデルに限らず、拡散モデルと言語モデルにも着目し、『生成モデルの理解と学習済み生成モデルを活用した異常パターンの生成と理解』と『大規模生成モデルが持つ分布外生成能力の異常検知タスクへの応用と評価』の2点に引き続き取り組む。
次年度使用額が生じた理由	予算の差額が生じた理由は、国内開催の国際会議での発表による旅費の節約と、2023年度には論文投稿を行わなかったことの2点である。次年度は論文投稿で使用予定である。

研究成果
(1件)

すべて学会発表 (1件) (うち国際学会 1件)

[学会発表] Image inpainting for large and irregular mask based on partial convolution and cross semantic attention2023
- 著者名/発表者名
  Yin Wang, Hiroaki Aizawa, Takio Kurita
- 学会等名
  Asian Conference on Pattern Recognition (ACPR)
- 国際学会