深層生成モデルの潜在空間の探索からの異常パターンの生成と理解

研究課題

研究課題/領域番号	22K17912
研究種目	若手研究
配分区分	基金
審査区分	小区分61010:知覚情報処理関連
研究機関	広島大学
研究代表者	相澤宏旭広島大学, 先進理工系科学研究科(工), 助教 (30910301)
研究期間 (年度)	2022-04-01 – 2025-03-31
研究課題ステータス	交付 (2022年度)
配分額 *注記	2,860千円 (直接経費: 2,200千円、間接経費: 660千円) 2024年度: 260千円 (直接経費: 200千円、間接経費: 60千円) 2023年度: 260千円 (直接経費: 200千円、間接経費: 60千円) 2022年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
キーワード	生成モデル / 異常検知 / 画像生成 / 深層学習
研究開始時の研究の概要	異常検知は、正常な状態からかけ離れた予期しない異常な観測データを検知するタスクである。特に、異常検知は外観検査等の産業応用や病気の早期発見等の医用診断への応用が積極的に取り組まれている。しかしながら、同一カテゴリ内の対象に対して、異常が対象の属性や構造などの意味的な要因に起因し、かつその異常が微細な場合の異常検知が見落とされている。そこで、本研究では、このような異常パターンに着目した異常検知に向けて、異常の特性に基づく異常検知タスクの細分化、異常検知手法の開発、異常パターンの生成と理解に取り組む。
研究実績の概要	2022年度では、『大規模生成モデルが獲得した潜在空間の探索』および『利用する大規模生成モデルの調査』を主要な研究課題として、大規模生成モデルの潜在空間からの異常パターンの生成と理解に取り組んだ。前述の課題について、写実的で現実的な画像を生成可能な生成モデルであるStyleGANを用いて、異常パターンを生成する方法について検討した。具体的には、StyleGANが獲得した潜在空間を利用して、ユーザから与えられた属性（例えば、対象の特定の構成要素など）を制御する手法について検討した。実験では、人の顔に関する標準的なデータセットを用いて、潜在変数からラベル属性情報を回帰するニューラルネットワークを構築することで、潜在空間上での属性分離を効果的に実現できることを実証した。結果は、異常ラベルが利用可能であれば、異常パターンを生成することができることを示し、これに基づいて、異常パターンを生成するための枠組みの構築に向けた取り組みを進めていく予定である。後者の課題として、拡散モデルの調査を行なった。拡散モデルは従来の生成モデルと比較して、より写実的で、細部まで意味が一貫した高品質な画像を生成できることが報告されている。拡散モデルの生成能力は、当初想定していたStyleGANよりも優れている可能性があるとされていることに加え、本研究課題は、StyleGANが持つ分布外生成能力に基づいているため、今後は異常検知のために画像生成の質と分布外生成能力を含め、大規模生成モデルの適切なモデリングについて検討する必要がある。
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由 2022年度では、本研究課題のキーアイデアである生成モデルが学習した潜在空間の理解とその操作技術に関する検討を達成した。特に、データセットに含まれないラベル属性の組み合わせであっても、StyleGANがもっともらしい画像を生成・操作できることを実証した。ただし、異常検知タスクでの生成モデルの評価については、予定していたエフォートを確保できず、遅れが生じている。今後は、2022年度で明らかにした成果をもとに、異常検知タスクへの応用に努める。
今後の研究の推進方策	2年目については、当初の計画に従い、『生成モデルの理解と学習済み生成モデルを活用した異常パターンの生成と理解』と『大規模生成モデルが持つ分布外生成能力の異常検知タスクへの応用と評価』の2点に取り組む。また、拡散モデルを利用した枠組みについても検討する予定である。

報告書

(1件)

2022 実施状況報告書

研究成果

(2件)

すべて 2023 2022

すべて学会発表 (2件) (うち国際学会 2件)

[学会発表] Facial Image Manipulation via Discriminative Decomposition of Semantic Space2023
- 著者名/発表者名
  Jiazhou Zheng, Hiroaki Aizawa, Takio Kurita
- 学会等名
  International Joint Conference on Neural Networks (IJCNN)
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] Additional Learning for Joint Probability Distribution Matching in BiGAN2022
- 著者名/発表者名
  Jiazhou Zheng, Hiroaki Aizawa, Takio Kurita
- 学会等名
  International Conference on Neural Information Processing (ICONIP)
- 関連する報告書
  2022 実施状況報告書
- 国際学会

深層生成モデルの潜在空間の探索からの異常パターンの生成と理解

研究代表者

相澤 宏旭 広島大学, 先進理工系科学研究科(工), 助教 (30910301)

2,860千円 (直接経費: 2,200千円、間接経費: 660千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[学会発表] Facial Image Manipulation via Discriminative Decomposition of Semantic Space2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Additional Learning for Joint Probability Distribution Matching in BiGAN2022

著者名/発表者名

学会等名

関連する報告書

相澤宏旭広島大学, 先進理工系科学研究科(工), 助教 (30910301)