• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

深層画像生成モデルのユーザ制御の研究

研究課題

研究課題/領域番号 23K11143
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61010:知覚情報処理関連
研究機関筑波大学

研究代表者

遠藤 結城  筑波大学, システム情報系, 助教 (00790396)

研究期間 (年度) 2023-04-01 – 2026-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2025年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2024年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード画像処理 / 生成モデル / 深層学習 / 拡散モデル / 敵対的生成ネットワーク / 画像生成
研究開始時の研究の概要

深層画像生成モデルの進歩は、人間が実写と見間違うほどの画像生成を可能にしつつあり、コンテンツ産業や顔認証など、様々な応用が期待される。本研究の目的は、深層画像生成モデルを制御することで、高品質な画像を柔軟に生成可能なフレームワークを確立することである。特にこれを実現する際に生じる未解決問題として、可制御性と多様性を考慮した技術の構築を目指す。

研究実績の概要

本年度より、深層画像生成モデルを制御することで、高品質な画像を柔軟に生成可能なフレームワークを確立することを目指し研究を推進した。具体的には、これを実現する際に生じる未解決問題として、(1)可制御性(深層画像生成モデルの出力をどの程度直感的に制御できるか)と(2)多様性(一つの属性入力に対して想定され得る複数スタイルの出力を得られるか)を改善する技術を開発した。

(1)可制御性については、近年目覚ましい進歩を遂げている拡散モデルに注目し、シーンのレイアウト構造を表す意味マスクを用いた、教師なしの画像生成手法を開発した。従来手法が同様の制御を実現するためには、教師データの作成にコストがかかるが、提案手法では拡散モデルの注意機構に着目することで、教師なしの方法を実現した。また、別のプロジェクトとして、人物のパラメトリック3Dモデルを入力とした、人物画像の姿勢や体型を制御する手法も開発した。既存手法は大きな姿勢や体型の変更時に歪みを生じる問題があったが、提案手法は学習済みの拡散モデルの知識を活用することで、歪みを補正する技術を新たに確立した。さらにもう一つのプロジェクトとして、人物の服装に特化した画像生成モデルを、テキスト入力によって制御する技術を開発した。本技術では、画像生成モデルである敵対的生成ネットワークの潜在変数をテキストに応じて効果的に操作するために、注意機構やマスクを用いたアプローチを導入した。

(2)多様性については、人物の顔画像の年齢編集に焦点を絞り、敵対的生成ネットワークの潜在空間を解析した。その結果、年齢属性について、縺れをほどいた潜在表現の獲得方法を確立し、これまでにない多様な人物画像の年齢編集を実現した。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

深層画像生成モデルのユーザ制御を実現するために、可制御性と多様性に着目し、研究を推進し、計画以上の成果が得られたためである。可制御性については、当初の計画では、敵対的生成ネットワークに対して、従来よりきめ細かい制御を目標に掲げていた。具体的には、敵対的生成ネットワークに対する、テキスト入力による新たな制御方法を開発し、国際会議で成果を発表しBest Student Paper Awardを受賞した。一方、近年の拡散モデルの爆発的な発展という背景をふまえて、拡散モデルに対するレイアウト制御方法も複数検討し、国際会議や海外雑誌において成果を発表した。これらの成果は国内の研究会でも発表賞などを受賞した。多様性については、当初の計画通り、敵対的生成ネットワークにおける、特定の属性(年齢)に関するスタイルの縺れを考慮した多様化手法の開発を達成し、国際会議で成果を発表した。

今後の研究の推進方策

深層画像生成モデルは、拡散モデルの登場に伴い、数か月単位の目覚ましいスピードで進歩している。当初の計画では、敵対的生成ネットワークを対象にした制御方法を検討しており、既に一定の成果を創出できている一方で、今後は拡散モデルに対するアプローチも、より一層検討を進めていく。特に、従来よりも柔軟かつ対話的な編集ができる軽量な拡散モデルの制御技術の確立を目指す。多様化については、これまでは顔画像の年齢属性の編集を扱ったが、他のカテゴリにも対象を広げながら、拡散モデルを用いたアプローチの開発も推進する。

報告書

(1件)
  • 2023 実施状況報告書
  • 研究成果

    (9件)

すべて 2024 2023 その他

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (6件) (うち国際学会 2件) 備考 (1件)

  • [雑誌論文] Masked-attention diffusion guidance for spatially controlling text-to-image generation2023

    • 著者名/発表者名
      Endo Yuki
    • 雑誌名

      The Visual Computer

      巻: - 号: 9 ページ: 6033-6045

    • DOI

      10.1007/s00371-023-03151-y

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] Age-dependent face diversification via latent space analysis2023

    • 著者名/発表者名
      Ito Taishi、Endo Yuki、Kanamori Yoshihiro
    • 雑誌名

      The Visual Computer

      巻: 39 号: 8 ページ: 3221-3233

    • DOI

      10.1007/s00371-023-03000-y

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [学会発表] StyleHumanCLIP: Text-guided Garment Manipulation for StyleGAN-Human2024

    • 著者名/発表者名
      Takato Yoshikawa, Yuki Endo, Yoshihiro Kanamori
    • 学会等名
      International Conference on Compuer Vision Theory and Applications (VISAPP) 2024
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] DiffBody: Diffusion-based Pose and Shape Editing of Human Images2024

    • 著者名/発表者名
      Yuta Okuyama, Yuki Endo, Yoshihiro Kanamori
    • 学会等名
      IEEE/CVF Winter Conference on Applications of Computer Vision (WACV) 2024
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] フォントスタイルを指定可能なテキストからの画像生成2024

    • 著者名/発表者名
      夏 馨,遠藤 結城,金森 由博
    • 学会等名
      情報処理学会 第 86 回全国大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Masked-Attention Diffusion Guidance によるText-to-Image の空間的制御2023

    • 著者名/発表者名
      遠藤 結城
    • 学会等名
      Visual Computing 2023
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 拡散モデルを用いた人物画像の姿勢と体型の編集2023

    • 著者名/発表者名
      奥山 裕大, 遠藤 結城, 金森 由博
    • 学会等名
      Visual Computing 2023
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] StyleHumanCLIP:StyleGAN-Humanを用いた人物画像のテキストによる服装操作2023

    • 著者名/発表者名
      吉川 天斗, 遠藤 結城, 金森 由博
    • 学会等名
      Visual Computing 2023
    • 関連する報告書
      2023 実施状況報告書
  • [備考] https://endo-yuki-t.github.io/

    • 関連する報告書
      2023 実施状況報告書

URL: 

公開日: 2023-04-13   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi