スナップ写真から全天球画像の生成

研究課題

研究課題/領域番号	21K11943
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61010:知覚情報処理関連
研究機関	上智大学
研究代表者	山中高夫上智大学, 理工学部, 准教授 (20433790)
研究期間 (年度)	2021-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	3,250千円 (直接経費: 2,500千円、間接経費: 750千円) 2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
キーワード	コンピュータビジョン / 画像生成 / 全天球画像 / 360°画像 / 敵対的生成ネットワーク(GAN) / VQGAN / 全天球カメラ / 画像外挿 / GAN / 仮想現実感 / cGAN / 深層学習 / 条件付き畳み込み層
研究開始時の研究の概要	本研究では，単一もしくは複数のスナップ写真から周りの状況を補間して自然な全天球画像を生成する方法の確立を目的とする。全天球画像とは，カメラの全方向を同時に撮影して得られる画像のことで，仮想現実感(VR)や拡張現実感(AR)のコンテンツを作成する際に利用される。広く普及している通常のカメラを使って全天球画像を生成できると，例えば，複数の観光名所を要約したような全天球画像の生成や，すでに撮影された2次元動画からそれらの状況を含むような3次元空間の再現などに応用できる。
研究成果の概要	本研究では，通常のスナップ写真から全天球画像を生成する課題を研究対象とした。全天球画像とは，カメラの全方向を同時に撮影して得られる画像のことで，仮想現実感(VR)や拡張現実感(AR)のコンテンツを作成する際に利用される。全天球画像の撮影には特殊なカメラが必要であり、それが普及の障害になっていると考えられるので、通常の写真から全天球画像を生成する手法の確立を本研究の目的とした。本研究では、生成した全天球画像の多様性を向上する手法、全天球画像生成に適した画像表現方法、事前学習済みVQGANコードブックを利用した高効率で高精度な生成手法を提案し、生成画像の多様性、精細さ、効率性を向上できた。
研究成果の学術的意義や社会的意義	学術的な意義として、画像生成技術の進歩が挙げられる。提案した手法により、通常の写真から生成された全天球画像の多様性、精細さ、効率性を向上できた。同様のアプローチを様々な画像生成タスクに還元できると考えられる。例えば、画像の超解像やInpainting, Outpaintingなどのタスクでほぼ同様の手法を活用できる。また、本研究により全天球画像の応用範囲が広がり、幅広い応用研究につながると考えられる。社会的意義として、仮想現実感や拡張現実感の普及、観光地や文化遺産のデジタル化などに寄与し、特定の場所を訪れていない人にも、その美しさや歴史的価値を伝えることが可能になることが挙げられる。

報告書

(4件)

研究成果
(7件)

すべて 2023 2022 2021 その他

すべて学会発表 (4件) (うち国際学会 1件) 備考 (3件)

[学会発表] Increasing diversity of omni-directional images generated from single image using cGAN based on MLPMixer2023
- 著者名/発表者名
  Atsuya Nakata, Ryuto Miyazaki, and Takao Yamanaka
- 学会等名
  Asian Conference on Pattern Recognition (ACPR)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] 階層型全天球画像生成モデル2022
- 著者名/発表者名
  宮崎龍斗，田畠誠大，山中高夫
- 学会等名
  電子情報通信学会PRMU研究会
- 関連する報告書
  2022 実施状況報告書
[学会発表] MLPMixerを用いた全天球画像生成2022
- 著者名/発表者名
  中田敦也, 山中高夫
- 学会等名
  第25回画像の認識・理解シンポジウム
- 関連する報告書
  2022 実施状況報告書
[学会発表] Omni-Directional Image Representation in GAN-based Image Generator2021
- 著者名/発表者名
  Keisuke Okubo and Takao Yamanaka
- 学会等名
  電子情報通信学会PRMU研究会
- 関連する報告書
  2021 実施状況報告書
[備考] Class-conditioned ODI generator (PyTorch) @GitHub
- URL
  https://github.com/keisuke-okb/class-conditioned-ODI-generator-pytorch
- 関連する報告書
  2023 実績報告書
[備考] odigen-mlpmixer @GitHub
- URL
  https://github.com/islab-sophia/odigen-mlpmixer
- 関連する報告書
  2023 実績報告書
[備考] 研究室ウェブページ
- URL
  https://scrapbox.io/islab-sophia/Resarch
- 関連する報告書
  2021 実施状況報告書

スナップ写真から全天球画像の生成

研究代表者

山中 高夫 上智大学, 理工学部, 准教授 (20433790)

3,250千円 (直接経費: 2,500千円、間接経費: 750千円)

報告書

研究成果

[学会発表] Increasing diversity of omni-directional images generated from single image using cGAN based on MLPMixer2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 階層型全天球画像生成モデル2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] MLPMixerを用いた全天球画像生成2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Omni-Directional Image Representation in GAN-based Image Generator2021

著者名/発表者名

学会等名

関連する報告書

[備考] Class-conditioned ODI generator (PyTorch) @GitHub

URL

関連する報告書

[備考] odigen-mlpmixer @GitHub

URL

関連する報告書

[備考] 研究室ウェブページ

URL

関連する報告書

山中高夫上智大学, 理工学部, 准教授 (20433790)