2017 年度実施状況報告書

ディープニューラルネットワークによる静止画像からの動画像生成手法の開発

研究課題

研究課題/領域番号	17K12689
研究機関	筑波大学
研究代表者	遠藤結城筑波大学, システム情報系, 助教 (00790396)
研究期間 (年度)	2017-04-01 – 2020-03-31
キーワード	コンピュータグラフィックス / 画像処理 / 深層学習 / ニューラルネットワーク / CNN / LSTM / 生成モデル
研究実績の概要	一枚の静止画像から動画像を生成することを目的として、ディープニューラルネットワークによる生成手法の開発に着手した。平成29年度の実施計画では、動画の多様な変化を扱うために、画素値の変化量を制限した複数のネットワークモジュールによって、色味とテクスチャのような変化の度合いが異なる要素に分けてモデリングすることを予定していた。実際に、動画中の色味あるいはテクスチャの変化を学習させるために、畳み込み層のエンコーダデコーダからなる次フレーム画像生成ネットワークと、特殊な正則化を利用した学習手法を開発した。特定のシーンに絞った小規模の学習データセットで予備実験を実施したところ、ベースラインの手法よりも質の高い結果を生成できることを確認しており、現在はさらに大きなデータセットを用いた評価実験を進めている。良好な結果が得られ次第、国際会議や学術誌への投稿を進めていきたい。また平成30年度以降の計画としてあげていた、長期間の予測が可能なモデルへの拡張方法も並行して検討した。Convolutional LSTM や3D 畳み込み処理を組み込んだネットワークを検討して、予備実験を実施したものの、現状は高品質な結果の生成には至っておらず、今後さらなる手法の改良を進めていきたい。他方で、ここで検討するモデルは、動画像に限らず他の2D や3D データを扱える汎用的なものであるため、本研究課題の促進を図り類似タスクの応用研究も推進した。具体的には画像の高階調化や領域分割手法も開発し、これらの成果は「Deep Reverse Tone Mapping」や「Transferring pose and augmenting background for deep human-image parsing」などのタイトルで国際会議や論文誌に採択されている。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由以下の点から、研究はおおむね順調に進展していると考える。 1）当該年度の実施計画に従い基礎となるモデルを開発し、大規模な実験は行えていないものの、簡易データセットによる実験で一定の有効性を確認した点。 2）次年度の計画である長期間の予測についても若干の検討を進めた点。 3）上記検討の過程で他の類似タスクの研究を遂行し、国際会議採択や学術誌採録につながった点。
今後の研究の推進方策	今後の課題として、まず（1）多様なシーンを含む大規模な動画データセットを実験用に構築する必要がある。Web からデータを収集し、ノイズとなるデータやフレームを、手作業あるいは何らかの自動化された方法で取り除く。次に（2）検討中のモデルに対する実験を実施し、現状の問題点を洗い出す必要がある。特定のシーンに限定された小規模データでは比較的良好な結果が得られているものの、モデルの汎化性能には限界があるため、現状のモデルでどの程度のバリエーションを学習可能かを明確にする。この段階で、学術的に価値のある結果が得られれば国際会議や学術誌に投稿する。また、現状のモデルの制約として扱えない動きが存在することが既に明らかであるため、（3）生成される動画の表現の幅を広げるためにモデルや学習手法のさらなる改良が課題となる。このためにadversarial loss を使った学習や、前述のLSTM や3D 畳み込みにもとづくさらなる改良を検討していく。

研究成果

(18件)

すべて 2018 2017 その他

すべて雑誌論文 (6件) (うち査読あり 6件、オープンアクセス 2件) 学会発表 (11件) (うち国際学会 3件、招待講演 1件) 備考 (1件)

[雑誌論文] Transferring pose and augmenting background for deep human-image parsing and its applications2018
- 著者名/発表者名
  Takazumi Kikuchi, Yuki Endo, Yoshihiro Kanamori, Taisuke Hashimoto, and Jun Mitani
- 雑誌名
  
  Journal of Computational Visual Media
  
  巻: - ページ: 1-12
- DOI
  https://doi.org/s41095-017-0098-0
- 査読あり / オープンアクセス
[雑誌論文] Approximating 3D Surfaces using Generalized Waterbomb Tessellations2018
- 著者名/発表者名
  Yan Zhao, Yuki Endo, Yoshihiro Kanamori, Jun Mitani
- 雑誌名
  
  Journal of Computational Design and Engineering
  
  巻: - ページ: -
- DOI
  https://doi.org/10.1016/j.jcde.2018.01.002
- 査読あり / オープンアクセス
[雑誌論文] 映像とセンサ信号を用いたドライブレコーダデータからのヒヤリハット検出手法2017
- 著者名/発表者名
  山本修平, 遠藤結城, 戸田浩之
- 雑誌名
  
  情報処理学会論文誌データベース（TOD）
  
  巻: 10 ページ: 26-30
- 査読あり
[雑誌論文] Deep Reverse Tone Mapping2017
- 著者名/発表者名
  Yuki Endo, Yoshihiro Kanamori, Jun Mitani
- 雑誌名
  
  ACM Transactions on Graphics (Proc. of SIGGRAPH ASIA 2017）
  
  巻: 36 ページ: 177:1-177:10
- DOI
  https://doi.org/10.1145/3130800.3130834
- 査読あり
[雑誌論文] Semi-Automatic Conversion of 3D Shape into Flat-Foldable Polygonal Model2017
- 著者名/発表者名
  Emi Miyamoto, Yuki Endo, Yoshihiro Kanamori, Jun Mitani
- 雑誌名
  
  Computer graphics Forum (Proc. of Pacific Graphics 2017)
  
  巻: 36 ページ: 41-50
- DOI
  http://doi.org/10.1111/cgf.13270
- 査読あり
[雑誌論文] 時間帯を考慮したパーソナライズ目的地予測2017
- 著者名/発表者名
  瀧本祥章, 西田京介, 遠藤結城, 戸田浩之, 澤田宏, 石川佳治
- 雑誌名
  
  電子情報通信学会論文誌 D
  
  巻: J100-D ページ: 472-484
- 査読あり
[学会発表] 線画イラストにおけるカーネルSVMを用いた閉領域の奥行き推定2018
- 著者名/発表者名
  昆将太郎，金森由博，遠藤結城，三谷　純
- 学会等名
  情報処理学会第80回全国大会
[学会発表] エッジ強調に基づくイラスト画像のための対話的領域分割2018
- 著者名/発表者名
  谷島拓実，金森由博，遠藤結城，三谷　純
- 学会等名
  情報処理学会第80回全国大会
[学会発表] Transferring Pose and Augmenting Background Variation for Deep Human Image Parsing2017
- 著者名/発表者名
  Takazumi Kikuchi, Yuki Endo, Yoshihiro Kanamori, Jun Mitani
- 学会等名
  Pacific Graphics 2017
- 国際学会
[学会発表] Improving Bivariate BRDF Acquisition by Optimizing Light Directions2017
- 著者名/発表者名
  Taisuke Hashimoto, Yoshihiro Kanamori, Yuki Endo, Jun Mitani
- 学会等名
  Pacific Graphics 2017
- 国際学会
[学会発表] Predicting Destinations from Partial Trajectories Using Recurrent Neural Network2017
- 著者名/発表者名
  Yuki Endo, Kyosuke Nishida, Hiroyuki Toda, and Hiroshi Sawada
- 学会等名
  PAKDD2017
- 国際学会
[学会発表] 映像とセンサを用いたドライブレコーダデータからのヒヤリハット検出手法2017
- 著者名/発表者名
  山本修平, 遠藤結城, 戸田浩之
- 学会等名
  WebDB Forum 2017
[学会発表] 長期的な状態依存性を考慮した移動軌跡からの目的地予測2017
- 著者名/発表者名
  遠藤結城，西田京介，戸田浩之，澤田宏
- 学会等名
  第84回MBL研究会
- 招待講演
[学会発表] ポーズ情報の考慮と背景データの拡張によるCNNを用いた人物画像の意味的領域分割2017
- 著者名/発表者名
  菊池敬済, 遠藤結城, 金森由博, 橋本泰輔, 三谷純
- 学会等名
  Visual Computing/グラフィクスとCAD合同シンポジウム 201
[学会発表] 簡略化モデルによる折紙形状構築手法2017
- 著者名/発表者名
  田中慎一, 遠藤結城, 金森由博, 三谷純
- 学会等名
  Visual Computing/グラフィクスとCAD合同シンポジウム 2017
[学会発表] 3次元形状を折りたたみ可能な立体へ自動変換する手法の提案2017
- 著者名/発表者名
  宮本惠未, 遠藤結城, 金森由博, 三谷純
- 学会等名
  Visual Computing／グラフィクスと CAD 合同シンポジウム 2017
[学会発表] 光源配置の最適化による2変数BRDF測定の改良2017
- 著者名/発表者名
  橋本泰輔, 金森由博, 遠藤結城, 三谷純
- 学会等名
  Visual Computing／グラフィクスと CAD 合同シンポジウム 2017
[備考] 研究成果に関するWebページ
- URL
  http://www.cgg.cs.tsukuba.ac.jp/~endo/

2017 年度 実施状況報告書

ディープニューラルネットワークによる静止画像からの動画像生成手法の開発

研究代表者

遠藤 結城 筑波大学, システム情報系, 助教 (00790396)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Transferring pose and augmenting background for deep human-image parsing and its applications2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] Approximating 3D Surfaces using Generalized Waterbomb Tessellations2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] 映像とセンサ信号を用いたドライブレコーダデータからのヒヤリハット検出手法2017

著者名/発表者名

雑誌名

[雑誌論文] Deep Reverse Tone Mapping2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] Semi-Automatic Conversion of 3D Shape into Flat-Foldable Polygonal Model2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] 時間帯を考慮したパーソナライズ目的地予測2017

著者名/発表者名

雑誌名

[学会発表] 線画イラストにおけるカーネルSVMを用いた閉領域の奥行き推定2018

著者名/発表者名

学会等名

[学会発表] エッジ強調に基づくイラスト画像のための対話的領域分割2018

著者名/発表者名

学会等名

[学会発表] Transferring Pose and Augmenting Background Variation for Deep Human Image Parsing2017

著者名/発表者名

学会等名

[学会発表] Improving Bivariate BRDF Acquisition by Optimizing Light Directions2017

著者名/発表者名

学会等名

[学会発表] Predicting Destinations from Partial Trajectories Using Recurrent Neural Network2017

著者名/発表者名

学会等名

[学会発表] 映像とセンサを用いたドライブレコーダデータからのヒヤリハット検出手法2017

著者名/発表者名

学会等名

[学会発表] 長期的な状態依存性を考慮した移動軌跡からの目的地予測2017

著者名/発表者名

学会等名

[学会発表] ポーズ情報の考慮と背景データの拡張によるCNNを用いた人物画像の意味的領域分割2017

著者名/発表者名

学会等名

[学会発表] 簡略化モデルによる折紙形状構築手法2017

著者名/発表者名

学会等名

[学会発表] 3次元形状を折りたたみ可能な立体へ自動変換する手法の提案2017

著者名/発表者名

学会等名

[学会発表] 光源配置の最適化による2変数BRDF測定の改良2017

著者名/発表者名

学会等名

[備考] 研究成果に関するWebページ

URL

2017 年度実施状況報告書

遠藤結城筑波大学, システム情報系, 助教 (00790396)