研究課題/領域番号 |
20H04216
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 国立情報学研究所 |
研究代表者 |
児玉 和也 国立情報学研究所, コンテンツ科学研究系, 准教授 (80321579)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
14,820千円 (直接経費: 11,400千円、間接経費: 3,420千円)
2023年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2022年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2021年度: 5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円)
2020年度: 5,850千円 (直接経費: 4,500千円、間接経費: 1,350千円)
|
キーワード | 3次元画像 / 光線 / 多眼 / 圧縮 / 符号化 / 3次元画像 |
研究開始時の研究の概要 |
超多眼映像は光線全体を稠密に取得再現し、単なる両眼視を越え同時に多数のユーザに対し様々な視点から対象の観察を可能とする。一方、そのデータ量は著しく膨大で、高能率圧縮による簡便な蓄積や伝送が新たに重要な課題となる。
本研究では、超多眼映像を動的な稠密光線場とみなすことで、撮影対象の3次元分布と良く対応した焦点ボケ画像群を介し、その本質的冗長性をまとめて抽出削減する圧縮方式を確立する。
具体的には、一般的な2次元動き補償等をバラバラに組み合わせる既存の多視点映像符号化と異なり、強く構造化された動的稠密光線場に応じた、焦点ボケ画像群の時系列上での3次元動き補償への統合などを様々に導入していく。
|
研究成果の概要 |
代表者らは従来から静的な稠密光線場の焦点ボケ構造を介した高能率符号化を提案しており、本研究では動的な稠密光線場である超多眼映像の圧縮にこれを拡張することを目的とした。具体的には、撮影対象の3次元分布と良く対応した焦点ボケ画像群上で、視差情報全体が統合的に表現可能な奥行き方向も合わせた動き補償を導入する超多眼映像の高能率符号化を提案し、その軽量化や高速実装による実時間伝送まで含め実証的評価を行った。とくに、基盤となる焦点ボケ画像群への変換の最適化やその残差の符号化に関わるフィルタ設計等も包括的に検討し、強く構造化された動的稠密光線場の本質的冗長性をまとめて抽出削減する圧縮方式を確立した。
|
研究成果の学術的意義や社会的意義 |
3次元画像技術は、単にステレオ映像を用いて両眼立体視したり、静的な撮影対象を自由な視点から観察したり、といった実装規模を抑えやすい課題を越え、超多眼化と動画化が並行して進んでいる。実際、「像」ではなく、それを発生させる「光線」そのものを情報として扱い、いわば<完全な光線場>を取得、再現しようとする先端的な視覚環境の構築が、新たに重要な課題となってきた。本研究では、こうした稠密かつ動的な光線情報が有する莫大なデータを、高速、高能率に圧縮する符号化を提案、その簡便な蓄積や伝送を実現した。これにより、当該の高度な視覚環境も柔軟に共有可能となり、本格的な実証段階への展開を拓いた。
|