2006 年度実績報告書

3次元ウエーブレット変換を用いたCUBE形動画像符号化方式

研究課題

研究課題/領域番号	17560347
研究機関	慶應義塾大学
研究代表者	池原雅章慶應義塾大学, 理工学部, 教授 (00212796)
キーワード	動画像符号化 / 3次元ウエーブレット変換 / 位相相関動き補償 / CUBE符号化
研究概要	平成17年度に予定していた課題はほぼクリアでき、複数枚のPフレームを1枚のIフレームを参照画像として動き予測・補償を行った。これにより時間方向の相関が低減でき、残差誤差をまとめてCUBEを構成する。このCUBEをウエーブレット変換し、さらにビットプレーンに分解し、上位ビットから符号化することによりプログレッシブな符号化が可能となった。この際分解されたビットプレーンも3次元のCUBEであるから、これを2次元のEZW-IPを新たに3次元に拡張した3次元EZW-IPを適用することにより、ビット制御が容易に行える。この中で、幾つかの問題が明らかになった。一つは動き補償の精度の問題であり、平成18年度は高速、高精度な動き推定アルゴリズムを開発した。現在の動き予測は膨大な計算量を必要とするブロックマッチングを用いているが、高速な推定を行うために、フーリエ変換に基づく位相領域で行う位相相関法が注目されている。すなわちあるフレームと参照フレームを高速フーリエ変換し、その位相差から、動きを予測する手法である。これによって計算量は大幅に減少するものの、動きの大きな領域では追従せず、予測誤差が大きくなってしまい、結果的に全体の符号化性能を悪化させている。そこで大きな領域で位相相関動き補償を適用し、大まかな動きを予測し、精度が不十分な場合には領域を4分割し、より精度の高い動き予測を行う。これをトップダウン的に繰り返す事で、高速かつ予測誤差の少ない動き補償が行える。この際、上位の領域で予測された動きを用いてあらかじめ動き補償を行っておき、下位の領域ではこの動き補償された画像を参照画像としてさらに位相相関動き予測を行う。従って最終的なブロックの動きベクトルは、各レベルの動きベクトルの総和となる。最終的に動きがゼロになれば分割は終了する。また分割の途中である領域の残差誤差があるしきい値より小さくなれば、その領域での分割も終了する。このような手法により、全体的な符号化性能も大幅に向上する。実際の動画に適用すると、動きの早い動画像に対しては、従来法に比べ非常に高速にかつ、総当りブロックマッチングと同等の動き補償ができることを確認した。