本研究は、遠方の対話者とあたかも1枚のガラスを通して話しているかのような臨場感ある画像通信を実現するTV電話システムに関するものである。通常のTV電話では、カメラをモニタ上部または横に設置せざるを得ない。このため、対話者の視線が一致することはなく、不自然な映像となる。また、人間は単眼でもその位置を移動させることにより、ある程度の立体感を得ることができる(運動視差という)。本研究の目標は、仮想的な視点における映像を生成するバーチャルカメラにより話者の視点における画像を生成すると同時に、視点移動に応じた擬似3次元的な映像を通常の2次元モニタ上に表示することにより、臨場感ある画像通信を実現することにある。 平成9年度は、人間頭部の模型を用いてその形状をリアルタイムに計測し、3次元モデルを生成する部分を中心に検討した。これは、モニタ上部の液晶ディスプレイを用いてビームパタンを照射し、モニタ横に設置した2台のTVカメラの映像を解析して3次元モデルを生成するものである。平成10年度は、対話者の視点を検出して上で述べた仮想的な視点情報とし、そこからガラス越しに見えるであろう対話者頭部のモニタ上への射影(2次元画像)を求め、これを表示する部分について検討した。平成11年度には、これらを統合し、システムとしての性能を評価した。3次元計測の部分では、2次元コードを投影する新たな手法を考案し、従来のスリット光投影法に比べ、ビーム走査に要する時間を1桁程度短縮できることを示した。また、話者視点画像の生成部では、OpenGLと称するグラフィック・ライブラリと専用アクセラレータを導入することにより、1桁近く高速化できることを確認した。今後、より詳細な評価・検討を進める予定であるが、今後の課題としては、人間頭部の毛髪等も精度よく計測できるよう、赤外線をはじめとする非可視領域のビーム光を投射する手法について、その可能性を検討することが挙げられる。
|