研究概要 |
商店での衣服の買い物のときに用いられる50語程度の手話単語をボランティアの手話通訳者に実演してもらい,学習用サンプル画像列を収集した.これに対して色を用いた手領域の抽出と追跡処理を行い,手の形状,位置,動きを特徴に用いてHMMによる単語学習をおこなった.このとき,顔と手,手どうしによる隠蔽を検出し,非隠蔽時に記憶させた顔と手のテクスチャを用いて隠蔽後の追跡を行った.認識時にはまず手位置と動きだけを学習させたHMMと照合して単語候補を限定し,残ったものを形も含めて学習させたHMMと照合することにより,誤認識を減少させた. 色を使うだけでは一般の背景や服装の元で手形状を切り出すことが困難なため,手動で切り出した手位置と輪郭形状の時間変化を遷移ネットワークに学習させ,エッジ画像と照合する手法を検討した.学習済みの遷移ネットワークを用いて,前時刻の手形状から複数の形状候補を予測し,エッジ画像と照合する.このとき,背景と手輪郭上にエッジが観測される確率モデルを作り,モデルから統計的に推定される真の手輪郭に由来するエッジの個数を最大にする照合基準を用いると,照合性能が向上することが実験で確認できた. 指や手首が微少に3次元回転すると,2次元的な見えが多様に変化するために登録画像との照合がうまく行かないことがあった.ありうる全ての画像を遷移ネットワークに登録するのは不可能であるので,予め手指の3次元的な関節構造モデルから2次元的な見えを多量に生成し,その見えの変動を統計的に学習することで,ロバストに照合する手法を研究した.各関節角度を大まかにサンプリングして典型姿勢とし,各典型姿勢の近傍で関節を微少に変化させた輪郭画像を生成する.得られた画像群を固有空間上のクラスタに分類する.各クラスタを正規分布で近似し,入力画像の尤度の高いモデルを推定結果とする.黒色の単純背景下での手指輪郭画像を用いた照合実験を行い,従来法で誤識別する例を正しく識別できた.
|