研究課題/領域番号 |
22K17912
|
研究機関 | 広島大学 |
研究代表者 |
相澤 宏旭 広島大学, 先進理工系科学研究科(工), 助教 (30910301)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
キーワード | 生成モデル / 異常検知 / 画像生成 |
研究実績の概要 |
2022年度では、『大規模生成モデルが獲得した潜在空間の探索』および『利用する大規模生成モデルの調査』を主要な研究課題として、大規模生成モデルの潜在空間からの異常パターンの生成と理解に取り組んだ。
前述の課題について、写実的で現実的な画像を生成可能な生成モデルであるStyleGANを用いて、異常パターンを生成する方法について検討した。具体的には、StyleGANが獲得した潜在空間を利用して、ユーザから与えられた属性(例えば、対象の特定の構成要素など)を制御する手法について検討した。実験では、人の顔に関する標準的なデータセットを用いて、潜在変数からラベル属性情報を回帰するニューラルネットワークを構築することで、潜在空間上での属性分離を効果的に実現できることを実証した。結果は、異常ラベルが利用可能であれば、異常パターンを生成することができることを示し、これに基づいて、異常パターンを生成するための枠組みの構築に向けた取り組みを進めていく予定である。
後者の課題として、拡散モデルの調査を行なった。拡散モデルは従来の生成モデルと比較して、より写実的で、細部まで意味が一貫した高品質な画像を生成できることが報告されている。拡散モデルの生成能力は、当初想定していたStyleGANよりも優れている可能性があるとされていることに加え、本研究課題は、StyleGANが持つ分布外生成能力に基づいているため、今後は異常検知のために画像生成の質と分布外生成能力を含め、大規模生成モデルの適切なモデリングについて検討する必要がある。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2022年度では、本研究課題のキーアイデアである生成モデルが学習した潜在空間の理解とその操作技術に関する検討を達成した。特に、データセットに含まれないラベル属性の組み合わせであっても、StyleGANがもっともらしい画像を生成・操作できることを実証した。ただし、異常検知タスクでの生成モデルの評価については、予定していたエフォートを確保できず、遅れが生じている。今後は、2022年度で明らかにした成果をもとに、異常検知タスクへの応用に努める。
|
今後の研究の推進方策 |
2年目については、当初の計画に従い、『生成モデルの理解と学習済み生成モデルを活用した異常パターンの生成と理解』と『大規模生成モデルが持つ分布外生成能力の異常検知タスクへの応用と評価』の2点に取り組む。また、拡散モデルを利用した枠組みについても検討する予定である。
|
次年度使用額が生じた理由 |
計画遂行の遅れにより、論文投稿費用が未使用となった。次年度に未使用分を論文投稿費用・学会参加費として利用する予定である。
|