近年のセンシング技術、ビジョン技術の進展により、3Dビデオシステムの開発が盛んである。3Dビデオとは被写体の映像のみならず3次元形状も記録するシステムであり、任意の視点から見た映像をCG技術により再生することが可能となる。しかし、時系列の点群(座標)データはデータ量が多いため、効果的な圧縮法が必要である。このためには、点群データを単一のポリゴンモデルに統合し、頂点の移動としてアニメーションを表現することが有効である。そこで、柔軟モデルを利用した点群統合化手法を開発してきたが、本年度は同手法に以下の改良を行った。 (1)接続処理 初期ポリゴンモデルをエネルギー最小化により変形させ統合処理を行うので、手や足が交差するなどの状況では、局所解に陥り失敗することがある。このような場合には、当初のポリゴンモデルで統合処理を継続することは困難となり、再度、新たな初期ポリゴンモデルを生成し、統合を開始する必要がある。その結果、長時間のクリップに対しては、複数のポリゴンモデルが異なった区間を表すことになる。そこで、これら複数のポリゴンモデルを単一のポリゴンモデルに統合する処理を検討した。まず、ポリゴンモデルが表現する区間が重なるように、時間軸に関して正負両方向に統合処理を行う。ついで、重なる区間での動きの相関をポリゴンモデル間で求め、一方のモデルの頂点を他方の頂点の線形結合で表す。これにより、他方が表現するフレームでの頂点位置を推定する。この位置を初期値として最小化処理を行うことで局所解から逃れることが可能となる。 (2)位相変化 繋いだ手を離すなど、初期ポリゴンと異なる位相構造に変化する場合は、変形処理だけでは適切に対応することができない。そこで、変形エネルギーに基づいてモデルを分割し、再度最小化処理を行う手法を検討した。 (3)レンダリング 3Dビデオを写実的に表示するためには効果的なテクスチャマッピングを行うことが必要である。このとき、1枚のテクスチャでは全周囲をカバーすることは困難であるので、複数のカメラから得たテクスチャをブレンドして各点の色を決定する。ブレンドの重さは視点方向、カメラの方向など物体点の位置により変化する。従来法ではハードウェアの制限によりポリゴン毎に重みを計算しており、画像品質が低かった。そこで、GPUプログラミングを利用することにより、画素毎に重みを計算することで、高品質かつ高速なレンダリングを実現した。
|