研究概要 |
平成7年度は,人物のより複雑な動きに対応させるために,分割された任意形状の領域をアフィン変換により変形し,予測画像を作成することとした.さらに,予測誤差の伝送ではフレームが進むに従って蓄積される誤差にリフレッシュ対策として,1フレーム中につき4個のフレーム内ブロックを挿入することとした.本方式の特徴は,従来は矩形で行われていた動き補償を,任意形状で行うことにより画像の輪郭を考慮した動き補償を行うことにある.任意形状の領域分割は画像の濃度値の量子化画像から得られる等濃度領域を利用することによって得られるが,この等濃度領域は顔の3次元形状を良好に反映するばかりでなく,抽出も用意で比較的安定に行えるという特徴を持っている.この等濃度領域に基づいて抽出された領域を変形させ,これをテンプレートとしてマッチングを行い最適なアフィンパラメータを算出し,この値に従って領域毎に変形・マッピングを行うことで予測画像は作成される.誤差画像の伝送では,画像を8×8画素のブロックに分割し,誤差の少ないブロックについては誤差を伝送しないブロック,誤差の多いブロックについては誤差を伝送するブロックという2種類に分類し,この情報とともに誤差を伝送するブロックのうち画質の悪いブロックを4つ取り出しこのブロックについてJPEG符号化を適用することとした. 上記提案方式に基づき,標準動画像“Claire"および“Misse America"(画像サイズ176×144,フレームレート10Hz)を対象に実験を行った結果,“Claire"では,平均1739bits/frame,SN比は33.46dBとなり,“Miss America"では,平均2099bits/frame,SN比は34.33dBとなった.これらの結果から本方式が極低ビットレートでの動画像符号化について有効な方式であることが確認できた.
|