本研究では、多眼動画像を圧縮する方法として、(1)多眼動画像から三次元幾何モデルを抽出し、(2)抽出したモデルを利用して動画像を圧縮する、という枠組みを追求した。三次元モデルを基に生成された動画像の場合には、(2)として、三次元表現とイメージ表現とを組合せながら画像を表現し圧縮するという方法が知られていた。しかし、一般の動画像の場合には、参照できる三次元モデルがないため、こうした方法が適用できなかった。 こうした状況を踏まえ、主に(1)の部分に焦点をあげて研究を進めた。平成10年度には、多眼動画像から三次元形状のボクセル表現を復元する方法を得た。この方法は、処理のハードウエア化が可能で、ステレオマッチング法の高速化版とも考えることができる。しかし、得られる三次元形状は、点の集合として表現されていたため、圧縮には不向きであった。 本年度は、多眼動画増から三次元形状のポリゴン表現を得る方法を開発した。この方法は、前年度の方法と同様、その大部分がハードウエアにより処理可能である。一方、多眼動画像をポリゴンの集合として近似することができ、同時に、近似に必要となるポリゴン数を最小限に押さえることができるため、多眼動画像のコンパクトな表現が可能で、圧縮などに好都合である。 以上により、予定していた(1)はほぼ完了したと言える。一方、(2)については基本的なアルゴリズムは試験できたものの、十分な検討ができないままに終った。様々な実映像を対象とした実験を施行し、(1)と(2)から成る枠組み全体の評価を行うことは、今後の課題として残されている。
|