2023 Fiscal Year Research-status Report
Human Visual Properties based Image/Video Compression Research
Project/Area Number |
22K17921
|
Research Institution | Juntendo University |
Principal Investigator |
孫 哲 順天堂大学, 健康データサイエンス学部, 講師 (40804662)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 視覚的注意 / 重要度マップ / 画像復元 |
Outline of Annual Research Achievements |
近年、テレビ会議や遠隔操作ロボット等のテレプレゼ ンスシステムの重要性が増している 。こうした視覚的な通信を高速にするために、動画像の高圧縮と高品質な復元が必要とされる。しかし、既存のH.265 、MPEG4等の圧縮法は通信技術の発展に伴ってレート歪の限界に近付きつつあり、新たな圧縮・復元技術が求められている 。令和5年度は、開発したフレームワークで圧縮したデータの符号化方法を探求した。この手法により、元の情報量の1%まで視覚特性に基づく圧縮が可能になった。一方、目的とする元の情報量の0.03%以下への圧縮は厳しく、復元処理の時間コストも大きいことが判明した。圧縮率を改良するため、符号化処理研究を調査し、調査した符号化方法を圧縮フレームワークを組み込んで、公開の画像データで検証した。復元処理の問題に対して、並列計算など方法を調査し、復元処理の高速化を探索した。 そのため、圧縮・復元処理の中心技術として、深層学習による画像の圧縮・復元には畳み込みニューラルネットワークをオートエンコーダーの手法として採用した。また、開発してきた視覚特性を反映する重要性マップを損失関数に組み込むことで、視覚特性に基づく深層学習の訓練を可能にした。訓練のために、公開されている画像データセットに対応する重要性マップデータセットの作成も新たに行った。現在、開発した深層学習モデルの訓練を行いつつ、最適なパラメータの探索を進めている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
入力画像の関心領域に基づくディザリング処理を用いた圧縮と、テンソル補完法を用いた復元を組み合わせたシステムにおいて、圧縮した画像の符号化結果は目的とする圧縮率への到達が難しく、復元処理の時間コストも大きいため、符号化と復元方法の高速化を模索した。
|
Strategy for Future Research Activity |
そこで、今期は圧縮・復元処理の中心技術として、重要性マップと深層学習手法を組み合わせた方法など改良方法を研究開発する。従来の定量的な画像評価指標に加え、重要性マップによる重みづけを取り入れた評価指標や、人間の被験者を用いた知覚実験による評価も実施する。
|
Causes of Carryover |
令和5年度には国際学会論文が採択されなかったため、出張予算を使用しなかった。令和6年度に国際学会へ論文を投稿し、その出張予算を令和6年度に使用する予定。
|