• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

映像符号化方式におけるDNNを利用した高効率動き補償予測方式の実現手法に関する研究

研究課題

研究課題/領域番号 23K03843
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分21020:通信工学関連
研究機関早稲田大学

研究代表者

亀山 渉  早稲田大学, 理工学術院, 教授 (90318858)

研究期間 (年度) 2023-04-01 – 2026-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2025年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2024年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード映像符号化 / 動き補償 / DNN / 予測フレーム生成 / 動き保証
研究開始時の研究の概要

従来の映像符号化方式を超える情報圧縮性能を達成することを目的として、映像符号化方式の圧縮性能に大きく寄与する動き補償予測方式に着目し、符号化済みフレームを学習データとして利用するDNN(Deep Neural Network)による動き補償予測方式について研究する。多様な動きに対する追従性能向上と生成フレームのボケを改善する高画質予測フレーム生成手法の検討、多様な映像内容を含んだ大量フレームの学習による汎化性能向上、映像情報圧縮性能の統合検証を通し、映像符号化方式におけるDNNの効率的かつ汎用的な利活用手法を明らかにする。

研究実績の概要

非定常な映像信号にルールベースで追従する従来の映像符号化方式を超える情報圧縮性能を達成するため、符号化済みフレームを学習データとして利用するDNNによる動き補償予測方式について、3年間の研究の初年度を終了した。
研究課題1「高画質予測フレーム生成」に関して、PredNetに複数の畳み込みを導入する手法を検討した。具体的には、PredNetに3×3、5×5、7×7の畳み込みを組み合わせて評価を行ったところ、実験で使用した映像では3×3及び5×5の組み合わせで最も良い予測フレームが得られることを確認した。また、これらの複数の畳み込みをPredNetに代わる新しいアーキテクチャとして提案されているPreCNetに導入する検討を行った。GANとPredNetの併用方法については、2022年度に前倒しで既に検討を行っており("GANとPredNetを用いた映像フレーム予測精度向上に関する検討",電子情報通信学会画像工学研究会,2022年3月)、2023年度はPreCNetにこれを導入する検討を行った。画像特徴量を考慮した損失関数の導入に関しては、既提案のGDL(Image Gradient Difference Loss)を拡張し、3×3、5×5及び7×7の組み合わせでエッジ特徴を抽出したものを損失関数として利用する手法を提案した。実験の結果、既提案のVGG16を利用した特徴量を損失関数として利用する手法に比べ、より少ない計算量で良い予測性能が得られる組み合わせの存在を確認した。以上に加え、時空間情報を利用した新しいフレーム予測手法について基礎的な検討を行い、高品質な予測フレーム生成の可能性を得た。
研究課題2「汎化性能向上」については、実験環境を整備を整備した。整備した実験環境を基に、2024年度に学習モデル生成を行っていくことを予定する。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

研究課題1「高画質予測フレーム生成」については、一部の検討課題は2022年度に前倒して研究を行っていたが、2023年度は、それを含めて、当初の計画通りに研究を遂行した。加えて、時空間情報を利用する新しい予測フレーム生成手法にも着手した。これについては、2024年度に研究成果を査読付き国際学会で発表する予定としている。研究成果については、査読付き国際会議2件、国内学会発表1件の発表を行い、予定通りの研究成果公表を行った。一方、PredNetに代わる新しいアーキテクチャとして提案されているPreCNetにこれらの提案手法を組み込む方法については方式検討に留まっているため、引き続き2024年度の検討課題とする。
研究課題2「汎化性能向上」については、当初の予定通りに実験環境構築を行った。よって、2024年度は当初の予定通りの研究計画を実施する。

今後の研究の推進方策

2023年度はほぼ計画通りに研究を遂行できたことから、研究期間2年目に当たる2024年も、当初の計画通りに研究を進めることとする。即ち、研究課題1「高画質予測フレーム生成」については、引き続き各種の新しい提案と改良方式の検討を進め、既存提案手法を含め、性能向上と最適化に関する検討を行うこととする。研究課題2「汎化性能向上」については、2022年度に構築した実験環境を利用し、大量のフレーム情報を利用した学習モデル生成実験を行うこととする。
また、研究課題3「統合検証」については、2025年度に予定する研究課題1及び2で検討した全ての成果を既存の映像符号化方式に組み込み、圧縮性能の観点からその有効性を確認する統合検証に向け、予定通り、計画の立案を行うと共に、統合検証に必要な環境構築を行う予定とする。具体的には、既存の映像符号化に種々の提案手法を組み込むためのシミュレーションソフトウェアの整備を行うこととする。

報告書

(1件)
  • 2023 実施状況報告書
  • 研究成果

    (3件)

すべて 2024 2023

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件) (うち国際学会 1件)

  • [雑誌論文] Performance analysis of generated predictive frames using PredNet with multiple convolution kernels2023

    • 著者名/発表者名
      Sakama Kanato、Sekiguchi Shunichi、Kameyama Wataru
    • 雑誌名

      Proc. SPIE 12592, International Workshop on Advanced Imaging Technology (IWAIT) 2023

      巻: 12592 ページ: 49-49

    • DOI

      10.1117/12.2666864

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [学会発表] Proposal of an Improved Loss Function Considering Image-edge Structure for DNN-based Video Prediction2024

    • 著者名/発表者名
      Hiroki NISHIMURA, Shunichi SEKIGUCHI, Wataru KAMEYAMA
    • 学会等名
      2024 International Workshop on Advanced Image Technology (IWAIT), No.10, Jan. 7-8, Langkawi, Malaysia
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] 空間的相関を捉える損失関数を使用したPreCNetの予測性能評価2024

    • 著者名/発表者名
      西村 洋輝, 関口 俊一, 亀山 渉
    • 学会等名
      2024年電子情報通信学会総合大会, D-11A-30
    • 関連する報告書
      2023 実施状況報告書

URL: 

公開日: 2023-04-13   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi