研究概要 |
映像を撮影するときのカメラワークならびにスイッチングを自動化するため、情報発生量ならびに登場人物の動作を認識し、この結果をもとに注目する領域を撮影する撮影自動化について次の成果を得た。 (1)時空間情報発生量の定義 画像中の時間的な動きに基づく時間領域情報発生量、各フレーム画像における空間的な情報の発生量をまず定義し、これら2つの情報を融合した時空間情報発生量を求める方法を示した。得られた時空間情報発生分布領域と人間が注目する領域が基本的には一致することを明らかにするとともに、リアルタイムでこの分布を求めるアルゴリズムを示した。 (2)動作認識・動作意図の推定 次に、映像上の人物領域を抽出し、人物の顔の3次元位置、向きの時間的変化、また手の動きをもとに動作を認識する。さらに、予め想定したシーンの下の調度品とかドアなどの3次元位置と人物の動きの関係から動作を認識・推定する手法を明らかにした。 (3)カメラワーク・スイッチング規則の構築と撮影自動化 時空間情報量の発生分布および分布領域の時間的な変化、また人物の動作認識結果をもとに、望ましいカメラ視点を得るためのPan, Tilt, Zoomなどのカメラワーク、また複数カメラ映像のスイッチングを行うための知識を構築するとともに、カメラワークならびにスイッチングの制御システムを構築し、遠隔講義ならびにテレビ会議を想定したシーンでその有効性を確かめている。
|