研究概要 |
従来のジェスチャによるヒューマンインターフェイスでは、ワイヤつきのグローブを付ける不便さがあった。これを解決するために、本研究では装着物を付けていない人体をTVカメラで撮影し、その時系列画像から、人体の三次元姿勢と動作を認識する手法について研究を行った。 まず単眼視シルエット動画像から手指の形状モデルと姿勢の推定を行う研究を行った。最初に3次元の大まかな初期形状モデルを用いて姿勢の推定を行いながら、同時に各関節の可動範囲や各指の長さ同士の関係など手指に関する知識を利用して、形状モデルの指の長さや関節角度の確率分布を計算し,画像に合わせてモデルを少しずつ修正する手法を考案した.購入した高速3-Dグラフィクス生成ボードと推定処理用パソコンを用いて実験システムを構築し、合成画像と実画像を用いて形状と姿勢の推定実験を行った結果、さまざまな手指姿勢の画像を入力すれば、関節角度や指の長さ、掌の大きさを概ね正しく推定できた.しかし,シルエットだけでは情報が不足する場合があるので,動きや距離を使って人物の姿勢を確率的に推定する手法を検討した.確率分布の近似計算に由来する誤差のために、画像特徴の抽出精度が悪い場合には形状と姿勢が正しく推定されないことがあり、これを解決するには確率分布以外の手法を用いる必要があることがわかった。 次に確率分布の代わりにありうるパラメー夕の範囲を楕円体で近似表現する手法を試した.この手法では画像特徴の抽出精度がよくない場合でも正しくパラメータ範囲を推定できることをシミュレーションによって確かめた.しかし,事前に予想した画像特徴の精度よりも実際の観測値の誤差が大きくなる場合には,やはり誤った推定値が得られてしまうこともわかった.
|