研究課題/領域番号 |
22K17913
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 徳島大学 |
研究代表者 |
片山 貴文 徳島大学, 大学院社会産業理工学研究部(理工学域), 助教 (70848522)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2024年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
|
キーワード | 動画像符号化 / 機械学習 / 単視点多眼映像符号 / Versatile Video Coding |
研究開始時の研究の概要 |
小型IoTデバイスには単視点多眼映像が取得可能なカメラセンサが提供されている。しかしながら、単視点多眼映像から取得される映像の圧縮技術や認識技術の方法には多くの冗長性が未だ含まれており、より効率的な手法が必要とされている。本研究では、広角カメラ映像と望遠カメラ映像の空間的相関性をScalable Video Coding (SVC)規格や機械学習を応用することで明らかにし、これまで提案された圧縮技術や認識技術の効率化を目指す。本研究を完遂することで、小型カメラをターゲットとした新規画像処理システムへの応用が期待できる。
|
研究実績の概要 |
小型IoTデバイスには単視点多眼映像が取得可能なカメラセンサが提供されている。しかしながら、単視点多眼映像から取得される映像の圧縮技術や認識技術の方法には多くの冗長性が未だ含まれており、より効率的な手法が必要とされている。本研究では、広角カメラ映像と望遠カメラ映像の空間的相関性をScalable Video Coding (SVC)規格や機械学習を応用することで明らかにし、これまで提案された圧縮技術や認識技術の効率化を目指す。本研究を完遂することで、小型カメラをターゲットとした新規画像処理システムへの応用が期待できる。 本研究は、単視点多眼映像における動画像符号化及び認識処理を、スケーラブル符号化と機械学習を利用することで高効率かつ高認識率を実現する画像処理システムの構築を目的とする。スケーラビリティのある高効率符号化方式と機械学習を用いた共通Convolutional Neural Network(CNN)やTransformerによる画像認識手法を組み合わせることで演算コストと処理性能の最適なトレードオフを実現し、単視点多眼映像向け画像処理システムを構築する。 本年度は、超高解像度単視点多眼映像の検証と解析を中心に研究を行なった。本フェーズでは、超高解像度単視点多眼映像の符号化性能の検証とデータセットの作成を行う。符号化性能の検証はScalable Video Coding (SVC)規格をVVCに応用し、Wide-angle sequence (WS)-Telephoto sequence(TS)間の空間的相関関係を明らかにする。 研究成果としては、1,主要な機械学習アルゴリズムを提案したこと、2,単視点多眼映像のデータセットの生成の2点である。これらに関連する研究成果を研究論文としてまとめ、複数の国際会議で発表を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
令和4年度(本年度)は符号化性能の検証はSVC、MVC規格をVVCに応用し、WS-TS間の空間的相関関係を解明する予定であったが、当初の予定より実装に工数が必要になっている。近年では、VVC向けの高速並列演算用のアルゴリズムが公開されており、それを基にした、処理方法の提案が必要となっている。令和5年度の上期で当初予定していた工程まで加速させる。
|
今後の研究の推進方策 |
令和5年度は、スケーラビリティのある高効率符号化方式の実装が大きな課題として残されているので、その課題を中心とし、システム全体の開発に着手する。また、多眼カメラを応用した並列処理に特化した機械学習手法の提案が必要であることから、並列的に進める。最終年に向け上記2点の課題に対して重点的に取り組む。
|