2020 Fiscal Year Annual Research Report
Study on the application of machine learning technologies to image compression coding
Project/Area Number |
18K11360
|
Research Institution | Chiba Institute of Technology |
Principal Investigator |
八島 由幸 千葉工業大学, 情報科学部, 教授 (60550689)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 画像符号化 / 機械学習 |
Outline of Annual Research Achievements |
最終年度は,DNN(Deep Neural Network)を利用して複数フレームから推定した幾何変換行列を適応的に切り替えるフレーム間予測手法,および自然画像とは信号特性が異なるアニメーション動画に対してDNNとガウシアンフィルタを組み合わせた新しい予測手法の提案を行い,良好な性能が得られることを明らかにした.また,K-SVDにより複数の辞書(基底の集合)を学習し,辞書の適応選択とその辞書に含まれる基底の線形結合で符号化を実現する機械学習型の画像圧縮方式「マルチクラスK-SVD符号化」を提案し,有効性を示した.さらに,DNNのモデル圧縮について,畳み込み層の各係数に対して,線形量子化とMax量子化を層別に切り替える手法や,量子化幅の層別適応化手法を提案し,画像認識精度を1%以内に抑えつつDNN記述情報量を最大1/80に圧縮可能であることを明らかにした. 研究期間全体を通じては,機械学習と画像圧縮符号化を組み合わせた技術を様々な角度から多面的にアプローチして画期的な成果を示すことができた.符号化のキー技術である「予測処理」および「変換処理」において,従来の信号処理的な枠組みを超えて,DNNによるフレーム間予測値生成,および機械学習によって生成した辞書を用いた新たな変換アルゴリズムを提案し,HEVC等の標準方式よりも優れた性能が得られる可能性を示した.また,DNN中間層出力を用いた画質推定手法を新たに提案し,テクスチャ合成符号化のような新しい圧縮手法の評価に活用できることを示した.さらにDNNそのものの圧縮符号化にも検討の幅を広げ,全結合層に対する特異値分解と,畳み込み層に対する適応量子化によって,画像認識精度をほとんど低下させることなくDNNの大幅な情報量削減を可能にし,DNN自体の容易なネットワーク分配や,軽量端末での画像認識が可能であることを示した.
|