研究課題/領域番号 |
21K12052
|
研究機関 | 中京大学 |
研究代表者 |
青森 久 中京大学, 工学部, 教授 (20453607)
|
研究分担者 |
大竹 敢 玉川大学, 工学部, 教授 (20296883)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 可逆画像伝送 / ビット深度拡張 / セルラーニューラルネットワーク / レートコーディング / Predictive Filter Flow / 周波数に基づくロス関数 |
研究実績の概要 |
研究計画に基づき次の2項目について研究を進展させた.これらの成果と本研究課題に関連した周辺技術については,査読付き学術論文や査読付き国際会議において公表または公表が決定されている. 1.SD-CNNによる画像の可逆パルス伝送方式の開発 昨年度の研究において,SD-CNNによる画像の可逆パルス伝送方式を実現した.今年度は,まずパルス伝送方式の汎用性を高めるためにテキストデータの可逆伝送方式を開発した.テキストデータについては,データ複製が必要となり,伝送効率の観点から課題が残るが,画像以外のデータのパルス伝送方式の道を拓いた.次に,伝送効率の改善を目的に,2層SD-CNNによる可逆パルス伝送方式を開発した.この方式は,様々な解像度を持つ約4700枚の画像を58回程度のイタレーションで可逆パルス伝送することに成功しており,昨年度の方式から80%程度の伝送効率の改善を達成している.また,2層SD-CNNの各層へのフィードバックゲインを調整することで,パルス伝送の初期性能が変化することを明らかにし,階調圧縮の更なる性能改善への道を拓いた. 2.ビット深度拡張のための深層学習モデルの開発 今年度は,(1)ビット深度拡張のための新たなネットワークモデルの開発および(2)Transformerを導入した新たなEnd-to-Endな深層学習モデルの導入について検討を行った.(1)では,従来手法であるBitNetに新たなアテンション構造を導入したモデルを提案し,実験によりその有効性について明らかにした.(2)では,Swin Transformerを導入したネットワークモデルをデモザイキングに適用することにより,アテンション機構の画像予測における有効性について検討し,従来手法と比較して優れた性能を持つことを確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度は,SD-CNNによる可逆画像伝送方式とビット深度拡張のための深層学習モデルの開発の双方について更なる性能改善を果たすことができ,研究計画を順調に前進させることができたと考えている.
|
今後の研究の推進方策 |
1.SD-CNNが出力するパルス画像群による階調圧縮とそのビット深度拡張方式の開発 まず,2層SD-CNNの各層へのフィードバックゲインを入力画像毎に最適化することで,階調圧縮画像の画質改善に取り組む.これと平行し,研究の集大成として,今までの研究で開発したビット深度拡張方式をSD-CNNが出力するパルス画像群により階調圧縮された画像に適用し,画質の差を人間の視覚が認識できない品質でビット深度を伸張する方式の開発を目指す. 2.ビット深度拡張 Swin Transformerにおけるアテンション機構が,画像予測に有効であることが確認できたことから,これをビット深度拡張に適用した方式の開発に取り組む.
|
次年度使用額が生じた理由 |
新型コロナウイルス感染症の拡大に伴い国際学会が完全オンライン開催となったため,旅費を支出しなかった. これにより生じた次年度使用額については,本研究課題に関連したテーマに従事する学生の学会発表旅費などに有効活用する予定である.
|