• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

限られた教師データを用いた意味的画像合成モデルの開発

研究課題

研究課題/領域番号 20K19816
研究種目

若手研究

配分区分基金
審査区分 小区分61010:知覚情報処理関連
研究機関筑波大学

研究代表者

遠藤 結城  筑波大学, システム情報系, 助教 (00790396)

研究期間 (年度) 2020-04-01 – 2023-03-31
研究課題ステータス 完了 (2022年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2021年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2020年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
キーワード深層学習 / 画像生成 / GAN / 意味的画像合成 / 畳み込みニューラルネットワーク / GAN inversion / コンピュータグラフィックス / コンピュータビジョン / 変分オートエンコーダ / 画像合成
研究開始時の研究の概要

意味的画像合成は、ユーザがキャンバス上に「ここは建物、ここは木」という風に粗くラベルを塗るだけで、直感的に画像を生成できる技術であり、世界的に注目を集めている。深層学習によって大量の教師データを用いた学習をすれば写実的な画像を作れるが、教師データ作成の人的コストは大きい。本研究では、限られたラベル付教師データやラベルなし訓練データを効率的に活用できる深層学習の枠組みを開拓し、従来よりも高品質な意味的画像合成の実現を目指す。

研究成果の概要

意味的画像合成とは、画素単位で建物や木々などの意味情報をラベル付けしたレイアウトのマップから画像のを生成する技術である。本研究では、少量のラベル付き教師データだけを用いて、高品質かつ多様な意味的画像合成が可能なアルゴリズムを開発した。さらに、ラベル付き教師データを全く用いずに、画像生成のレイアウトを制御する手法も開発した。研究成果として、意味的画像合成の多様化技術(国内発表2件、雑誌論文・国際会議論文2件)、few-shot意味的画像合成技術(国内発表1件、雑誌論文・国際会議論文1件)、zero-shot画像生成制御技術(国内発表1件、雑誌論文・国際会議論文1件)などの論文成果が得られた。

研究成果の学術的意義や社会的意義

本研究成果は、ここ数年で急速に発展している画像生成モデルにおいて、ユーザが介入可能な方法を開拓し、意味ラベルマップなど用いて出力を従来よりも低コストで、柔軟かつ多様に制御可能な方法を示したことに学術的な意義がある。社会的には、コンテンツ産業における創作活動の促進だけでなく、自動運転や医用画像解析の画像認識モデルの精度向上のための訓練データの構築など、本技術の広範な応用が期待できる。

報告書

(4件)
  • 2022 実績報告書   研究成果報告書 ( PDF )
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 研究成果

    (11件)

すべて 2022 2021 2020 その他

すべて 雑誌論文 (4件) (うち査読あり 4件) 学会発表 (6件) (うち国際学会 3件) 備考 (1件)

  • [雑誌論文] Diversifying detail and appearance in sketch-based face image synthesis2022

    • 著者名/発表者名
      Yoshikawa Takato、Endo Yuki、Kanamori Yoshihiro
    • 雑誌名

      The Visual Computer

      巻: 38 号: 9-10 ページ: 3121-3133

    • DOI

      10.1007/s00371-022-02538-7

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] Controlling StyleGANs using rough scribbles via one‐shot learning2022

    • 著者名/発表者名
      Endo Yuki、Kanamori Yoshihiro
    • 雑誌名

      Computer Animation and Virtual Worlds

      巻: 33 号: 5

    • DOI

      10.1002/cav.2102

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] User‐Controllable Latent Transformer for StyleGAN Image Layout Editing2022

    • 著者名/発表者名
      Endo Y.
    • 雑誌名

      Computer Graphics Forum

      巻: 41 号: 7 ページ: 395-406

    • DOI

      10.1111/cgf.14686

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] Diversifying Semantic Image Synthesis and Editing via Class‐ and Layer‐wise VAEs2020

    • 著者名/発表者名
      Endo Y.、Kanamori Y.
    • 雑誌名

      Computer Graphics Forum

      巻: 39 号: 7 ページ: 519-530

    • DOI

      10.1111/cgf.14164

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり
  • [学会発表] Diversifying detail and appearance in sketch-based face image synthesis2022

    • 著者名/発表者名
      Yoshikawa, T., Endo, Y. & Kanamori, Y.
    • 学会等名
      Computer Graphics International 2022
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] Controlling StyleGANs using rough scribbles via one-shot learning2022

    • 著者名/発表者名
      Yuki Endo, Yoshihiro Kanamori
    • 学会等名
      Computer Graphics International 2022
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] User-Controllable Latent Transformer for StyleGAN Image Layout Editing2022

    • 著者名/発表者名
      Yuki Endo
    • 学会等名
      Pacific Graphics 2022
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] StyleGAN を用いたテキストによる人物画像の服装編集手法2022

    • 著者名/発表者名
      吉川 天斗,遠藤 結城, 金森由博
    • 学会等名
      第 189 回コンピュータグラフィックスとビジュアル情報学研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] ユーザ制御可能なLatent Transformer を用いたStyleGAN 画像のレイアウト編集2022

    • 著者名/発表者名
      遠藤 結城
    • 学会等名
      Visual Computing 2022
    • 関連する報告書
      2022 実績報告書
  • [学会発表] StyleGAN Prior を用いたFew-shot 意味的画像合成2021

    • 著者名/発表者名
      遠藤結城、金森由博
    • 学会等名
      Visual Computing 2021
    • 関連する報告書
      2021 実施状況報告書
  • [備考] 研究プロジェクトページ

    • URL

      http://www.cgg.cs.tsukuba.ac.jp/~endo/projects/clVAE/

    • 関連する報告書
      2020 実施状況報告書

URL: 

公開日: 2020-04-28   更新日: 2024-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi