本研究では、視覚入力として1枚の画像から、モデルとしてあらかじめ与えられた物体の位置・姿勢を推定する手法を提案した。物体モデルは剛体と関節物体である。視覚入力は、画像からエッジのみを抽出したエッジ画像、画像を適切に2値化して得た物体のシルエット画像とする。本研究で扱う問題は、この入力画像と物体モデルから生成した線画を重ね合わせたとき、最もよく重なるような物体モデルの位置・姿勢を求めることである。本研究では、この問題に対して、複雑な解空間での最適解探索に適している遺伝的アルゴリズム(GA)を適用し、位置・姿勢推定問題に固有の性質を用いて、画像のノイズや背景、隠蔽に対してもロバストなアルゴリズムを構築した。具体的には、以下の通りである。 (1)入力エッジ画像と物体モデルの線画との重なりを評価する新しい評価関数を提案した。4つの方向を抽出するフィルタをかけて、それぞれ同じ方向での黒画素の重なる割合を評価関数値とする。提案する評価関数は、従来の方式に比べわずかな計算時間の増加で、局所解に陥る可能性を大幅に削減する。 (2)物体モデルをあらゆる角度から見たときの(あらゆる姿勢の)線画の類似度を調べ、姿勢推定に利用する手法を提案した。まず、球面上を細かく分割し、それぞれの位置から見たモデルの線画間の類似度を(1)で提案した評価関数を用いて求め、類似度の高い姿勢同士のリスト(類似姿勢リスト)を作成する。局所解に陥ったとき、類似姿勢リストから類似度の高い別の複数の姿勢を取り出し、その姿勢を初期値として再探索を行うことにより、探索効率を高める。 (3)入力シルエット画像から横向き人体の位置・姿勢をスティックモデルを用いてGAで推定する手法を提案した。関節物体の姿勢を表すパラメータ空間は、剛体姿勢のパラメータ空間に比べて、極めて大きい。そのため、入力画像とモデルの関係から入力探索空間を限定する工夫を行った。
|