2022 年度実績報告書

稠密光線場処理に基づく超多眼映像の高速かつ高能率な圧縮符号化技術の研究

研究課題

研究課題/領域番号	20H04216
研究機関	国立情報学研究所
研究代表者	児玉和也国立情報学研究所, コンテンツ科学研究系, 准教授 (80321579)
研究期間 (年度)	2020-04-01 – 2024-03-31
キーワード	3次元画像 / 光線 / 多眼 / 圧縮 / 符号化
研究実績の概要	代表者らは従来から静的な稠密光線場の焦点ボケ構造を介した高能率符号化を提案しており、本研究では動的な稠密光線場である超多眼映像の圧縮にこれを拡張することを目的とする。具体的には、撮影対象の３次元分布と良く対応した焦点ボケ画像群上で、視差情報全体が統合的に表現可能な奥行き方向も合わせた動き補償を導入する超多眼映像の高能率符号化を提案し、その軽量化や高速実装による実時間伝送まで含め実証的評価を行う。当該の枠組に加え、基盤となる焦点ボケ画像群への変換の最適化やその残差の符号化に関わるフィルタ設計等も包括的に検討し、視点配置を前提にすることなく動き補償や視差補償をバラバラに組み合わせる形で標準化が進む既存の多視点映像符号化の単なる拡張ではない、強く構造化された動的稠密光線場の本質的冗長性をまとめて抽出削減する圧縮方式を確立する。本年度は、以上に述べた研究目的の達成に向け、令和３年度までに圧縮性能の実質的向上に注力した超多眼映像の符号化方式について、リアルタイム伝送への展開も考慮し、当該の符号化アルゴリズムの軽量化に取り組んだ。実際、実用的な圧縮符号化手法を構成するには、必要となる演算量の抑制も常に考慮しなければならない。とくに、実時間プロトタイプの構築に向け、シーンフロー推定部など提案する符号化を構成する各要素に応じ順次、十分な高速性と圧縮品質を維持する実装の検討を進めた。また、動き補償部のみならず、符号化側と復号側で共通となる光線場の予測について、非圧縮における同様の処理の実時間性を維持したまま、良好な圧縮品質が得られるよう、令和３年度までに提案したポストフィルタ等の組み込みも検討するなど、符号化の各要素を適宜、多数のGPUを搭載した計算サーバ上へ実装、それぞれのリアルタイム性を検証することで、超多眼の撮像系等と組合せた実時間プロトタイプの構成法を明らかにした。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由超多眼映像は光線全体を稠密に取得再現し、単なる両眼視を越え同時に多数のユーザに対し様々な視点から対象の観察を可能とする。一方、そのデータ量は著しく膨大で、高能率圧縮による簡便な蓄積や伝送が新たに重要な課題となる。本研究では、超多眼映像を動的な稠密光線場とみなすことで、撮影対象の３次元分布と良く対応した焦点ボケ画像群を介し、その本質的冗長性をまとめて抽出削減する圧縮方式を確立する。具体的には、一般的な２次元動き補償等をバラバラに組み合わせる既存の多視点映像符号化と異なり、強く構造化された動的稠密光線場に応じた、焦点ボケ画像群の時系列上での３次元動き補償への統合などを様々に導入していく。実際、こうした研究課題に対し、動き補償やフィルタ処理など前年度までに基本的な枠組を整備した符号化方式を前提として、本年度は、まず、提案する超多眼映像圧縮処理で必須となる、時系列上の焦点ボケ画像群の間での３次元動き補償に関し、あらたに３次元シーンフローの推定を導入、これまでの単純な３次元ブロックマッチングの演算量を大幅に削減した。代表者らは既に、一般的なオプティカルフロー推定を３次元の焦点ボケ画像群上に拡張することで、実時間で対象全体の３次元シーンフロー推定に成功していたが、こうしたフロー推定結果を手がかりに、圧縮品質を維持しつつ提案方式の最も本質的な構成要素である３次元動き補償の軽量化を実現した。また、本研究課題で取り扱う超多眼映像は、既存の標準的なデータセットが存在していないが、これも令和３年度を中心に構築した、単眼とミラー群の統合に基づく仮想カメラアレイにより、十分な品質の超多眼映像を取得することで、従来のように合成画像等での評価にとどまらない実証的な検討を進めた。以上から、本研究課題の進捗に関し、現在まで、おおむね順調に進展しているといえる。
今後の研究の推進方策	今後は、令和４年度までで提案した符号化方式について、各構成要素の成果を組み合わせ、超多眼映像に対する圧縮符号化システムのプロトタイプを構築、あらたに蓄積を介することのないリアルタイム伝送の実証的検討までを行う。とくに、単なる符号化処理のみならず、撮像系、伝送系、さらに表示系をも統合したプロトタイプとして、動的な稠密光線場である超多眼映像の簡便な共有を可能とする。具体的には、まず、撮像系において、単眼とミラー群の統合に基づく仮想カメラアレイの利点を最大限に活用、4K程度の単眼カメラを介し直接に GPU上へ稠密な光線情報を一括して入力する。こうした方式は、従来のカメラアレイから得られる各視点が独立した超多眼映像と異なり、稠密光線情報への集約を電子的に行う必要がない。実際、撮像系の出力がミラー群により 1台の実カメラへ光学的に単一化されることで、煩雑で一定の遅延が避けられない多眼カメラ間の同期機構を排し、さらに、運用上のコストも大幅に抑えることができる。一方、こうして GPU上にコンパクトに取り込まれた稠密光線情報も、そのまま伝送しようとすれば莫大な帯域を要する。そこで、これをただちに提案する符号化方式により圧縮、リアルタイムでの分散共有を実現する。この際、撮像系となる仮想カメラアレイから入力された取得情報に対し様々な幾何変換等が前処理として必要となるものの、これらは元来 GPUが極めて効率的に実行可能であり、令和４年度までの検討により大幅に高速化された提案する圧縮符号化方式とともに、動的な稠密光線情報を実時間でネットワーク上へ送出するプロトタイプを構成する。最終的には、通常の 2次元ディスプレイや各種の立体視ディスプレイ等、受信側の様々な表示系に対し、伝送された光線情報を提示することで、動的な稠密光線場を簡便に共有する超多眼系プロトタイプの構築、実証的検討に取り組む。

研究成果
(8件)

すべて 2023 2022 その他

すべて国際共同研究 (2件) 雑誌論文 (4件) (うち国際共著 3件、査読あり 4件、オープンアクセス 1件) 学会発表 (2件)

[国際共同研究] York University(カナダ)
- 国名
  カナダ
- 外国機関名
  York University
[国際共同研究] 天津財経大学(中国)
- 国名
  中国
- 外国機関名
  天津財経大学
[雑誌論文] Robust extension of light fields with probable 3D distribution based on iterative scene estimation from multi-focus images2023
- 著者名/発表者名
  Zhen Wang, Lan Huang, Kazuya Kodama
- 雑誌名
  
  Signal Processing: Image Communication
  
  巻: 111(116896) ページ: 1-13
- DOI
  10.1016/j.image.2022.116896
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Dense view interpolation of 4D light fields for real-time augmented reality applications2022
- 著者名/発表者名
  Hidemichi Yoshino, Kazuya Kodama, Takayuki Hamamoto
- 雑誌名
  
  APSIPA Annual Summit and Conference
  
  巻: 2022 ページ: 1626-1631
- DOI
  10.23919/APSIPAASC55919.2022.9979976
- 査読あり
[雑誌論文] Unrolling Graph Total Variation for Light Field Image Denoising2022
- 著者名/発表者名
  Rino Yoshida, Kazuya Kodama, Huy Vu, Gene Cheung, Takayuki Hamamoto
- 雑誌名
  
  IEEE International Conference on Image Processing
  
  巻: 2022 ページ: 2162-2166
- DOI
  10.1109/ICIP46576.2022.9897244
- 査読あり / 国際共著
[雑誌論文] 単視点から多視点へのデータ拡張に基づく4 次元光線情報のグラフ学習型雑音抑制の効率化の検討2022
- 著者名/発表者名
  吉田莉乃, 児玉和也, ヴューフイ, チョンジーン, 浜本隆之
- 雑誌名
  
  3次元画像コンファレンス
  
  巻: 2022(P-5) ページ: 1-4
- 査読あり / 国際共著
[学会発表] リアルタイム光線伝搬の簡易実装に向けた稠密視点補間の効率化と超多眼出力系への展開2022
- 著者名/発表者名
  吉野秀道, 児玉和也, 浜本隆之
- 学会等名
  画像符号化/映像メディア処理シンポジウム(PCSJ/IMPS 2022), P2-14, 82-83
[学会発表] 画素単位で重みを調整する忠実項を組み込んだグラフ学習に基づく4 次元光線情報の高精度雑音抑制2022
- 著者名/発表者名
  吉田莉乃, 児玉和也, チョンジーン, 浜本隆之
- 学会等名
  画像符号化/映像メディア処理シンポジウム(PCSJ/IMPS 2022), P1-12, 36-37

2022 年度 実績報告書

稠密光線場処理に基づく超多眼映像の高速かつ高能率な圧縮符号化技術の研究

研究代表者

児玉 和也 国立情報学研究所, コンテンツ科学研究系, 准教授 (80321579)

現在までの達成度 (区分)

理由

研究成果

[国際共同研究] York University(カナダ)

国名

外国機関名

[国際共同研究] 天津財経大学(中国)

国名

外国機関名

[雑誌論文] Robust extension of light fields with probable 3D distribution based on iterative scene estimation from multi-focus images2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Dense view interpolation of 4D light fields for real-time augmented reality applications2022

著者名/発表者名

雑誌名

DOI

[雑誌論文] Unrolling Graph Total Variation for Light Field Image Denoising2022

著者名/発表者名

雑誌名

DOI

[雑誌論文] 単視点から多視点へのデータ拡張に基づく4 次元光線情報のグラフ学習型雑音抑制の効率化の検討2022

著者名/発表者名

雑誌名

[学会発表] リアルタイム光線伝搬の簡易実装に向けた稠密視点補間の効率化と超多眼出力系への展開2022

著者名/発表者名

学会等名

[学会発表] 画素単位で重みを調整する忠実項を組み込んだグラフ学習に基づく4 次元光線情報の高精度雑音抑制2022

著者名/発表者名

学会等名

2022 年度実績報告書

児玉和也国立情報学研究所, コンテンツ科学研究系, 准教授 (80321579)