研究課題/領域番号 |
22K17912
|
研究機関 | 広島大学 |
研究代表者 |
相澤 宏旭 広島大学, 先進理工系科学研究科(工), 助教 (30910301)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
キーワード | 生成モデル |
研究実績の概要 |
2023年度では、『画像生成モデルの学習と応用』および『利用する大規模生成モデルの調査』を主要な研究課題として、画像生成モデルに関する研究を引き続き行なった。
前述の課題について、画像生成モデルの生成モデルを調査するために、画像中に欠落領域をもっともらしく補完するInpaintingタスクのための画像生成モデルについて検討した。具体的には、欠落領域が大きくなるほど画像生成モデルの補完は難しいという課題に対して、粗い生成から詳細な生成を行う二段階の画像生成の枠組みを提案し、従来手法を上回る結果を達成した。結果は、異常パターンの生成において、画像生成モデルを利用した場合、異常パターンの生成のためのモデルの構造や生成方法について示唆を与えるものであり、昨年度の結果とともに、これに基づいて、異常パターンを生成するための枠組みの構築に向けた取り組みを進めていく予定である。
また昨年度同様に拡散モデルに関する検討も行なっている。加えて、本研究課題の遂行期間中に、ChatGPTをはじめとする大規模言語モデルの登場により、言語による画像の認識と生成の制御が大きく進んだ。今後は画像単体からの生成モデルの構築だけでなく、特に、言語と組み合わせた画像生成モデルや異常検知方法の検討を進める必要がある。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2023年度では、本研究課題のキーアイデアである画像生成モデルのモデル構造に関する検討を達成した。ただし、異常検知タスクでの生成モデルの評価については、拡散モデルと大規模言語モデルの登場により、検討モデルの調査・実装を行なっているため遅れが生じている。
|
今後の研究の推進方策 |
3年目については、当初予定していたStyleGANなどの敵対的生成モデルに限らず、拡散モデルと言語モデルにも着目し、『生成モデルの理解と学習済み生成モデルを活用した異常パターンの生成と理解』と『大規模生成モデルが持つ分布外生成能力の異常検知タスクへの応用と評価』の2点に引き続き取り組む。
|
次年度使用額が生じた理由 |
予算の差額が生じた理由は、国内開催の国際会議での発表による旅費の節約と、2023年度には論文投稿を行わなかったことの2点である。次年度は論文投稿で使用予定である。
|