研究課題/領域番号 |
22K17921
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 順天堂大学 (2023) 国立研究開発法人理化学研究所 (2022) |
研究代表者 |
孫 哲 順天堂大学, 健康データサイエンス学部, 講師 (40804662)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
|
キーワード | 視覚的注意 / 重要度マップ / 画像復元 / 動画像圧縮 / テレプレゼンス / 顕著性マップ / 画質評価 |
研究開始時の研究の概要 |
テレビ会議やロボットを遠隔操作するシステムにおいて、通信で遅延を生じないことが重要であり、動画像データの高圧縮や復元技術が求められる。既存の研究ではビデオデータの空間的および時間的冗長性を削減する。客観的な冗長性の削減による圧縮性能の改善は限界に近付きつつある。そこで課題では、人間の視覚特性に基づいて、重要度マップのディザリング処理により入力画像/ビデオを圧縮する方法を提案する。重要度マップとは入力画像の顕著性マップ及び勾配強度マップから算出されるもので、入力画像の各画素の重要度値の空間分布を示す。また、圧縮の効果を評価するために、人間知覚を考慮した重みづけによる客観的品質評価指標も提案する。
|
研究実績の概要 |
近年、テレビ会議や遠隔操作ロボット等のテレプレゼ ンスシステムの重要性が増している 。こうした視覚的な通信を高速にするために、動画像の高圧縮と高品質な復元が必要とされる。しかし、既存のH.265 、MPEG4等の圧縮法は通信技術の発展に伴ってレート歪の限界に近付きつつあり、新たな圧縮・復元技術が求められている 。令和5年度は、開発したフレームワークで圧縮したデータの符号化方法を探求した。この手法により、元の情報量の1%まで視覚特性に基づく圧縮が可能になった。一方、目的とする元の情報量の0.03%以下への圧縮は厳しく、復元処理の時間コストも大きいことが判明した。圧縮率を改良するため、符号化処理研究を調査し、調査した符号化方法を圧縮フレームワークを組み込んで、公開の画像データで検証した。復元処理の問題に対して、並列計算など方法を調査し、復元処理の高速化を探索した。 そのため、圧縮・復元処理の中心技術として、深層学習による画像の圧縮・復元には畳み込みニューラルネットワークをオートエンコーダーの手法として採用した。また、開発してきた視覚特性を反映する重要性マップを損失関数に組み込むことで、視覚特性に基づく深層学習の訓練を可能にした。訓練のために、公開されている画像データセットに対応する重要性マップデータセットの作成も新たに行った。現在、開発した深層学習モデルの訓練を行いつつ、最適なパラメータの探索を進めている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
入力画像の関心領域に基づくディザリング処理を用いた圧縮と、テンソル補完法を用いた復元を組み合わせたシステムにおいて、圧縮した画像の符号化結果は目的とする圧縮率への到達が難しく、復元処理の時間コストも大きいため、符号化と復元方法の高速化を模索した。
|
今後の研究の推進方策 |
そこで、今期は圧縮・復元処理の中心技術として、重要性マップと深層学習手法を組み合わせた方法など改良方法を研究開発する。従来の定量的な画像評価指標に加え、重要性マップによる重みづけを取り入れた評価指標や、人間の被験者を用いた知覚実験による評価も実施する。
|