研究概要 |
本研究は,正面顔の1枚の画像から,4表情(幸福,悲しみ,怒り,驚き)の識別をコンピュータが行うことを目的とする.特に,任意の背景にたいして顔を画面から切り出し,表情認識することに重点を置く. 従来の表情認識の手法は,眉,目,口などを検出し,その幾何学的パラメータ,相互関係,時間的変化などから認識を行った.しかし,人間は顔全体のパターンを捉えて表情を認知すると考えられる.本研究は,人間の認知と深く関わっているポテンシャル場を利用する方式を拡張し,全体パターンから表情認識を行う. 顔領域に,エッジの強さに比例するポテンシャル場と場の力で変形するグリッド状のネットを想定する.グリッドの各ノードは,隣接ノードにスプリングで接続される.ネット定常状態での各ノードの移動量を特徴ベクトルと考え,画像パターンをノード数の次元の特徴ベクトルで表現する.多くの被験者の4表情に対する特徴ベクトルを算出し,各表情に対するモデルを作成し,入力画像の特徴ベクトルとモデルとの距離で表情を分類する.次元が高いため,KL展開により3次元の情緒空間に射影し,認識を行う.多くの画像に対して実験行い,有効性を確かめた. この方法の適用には,顔領域を正しく検出する必要がある.顔の共通モデルとして,ポテンシャル場から得られた特徴ベクトルを用いたモザイク構造で共通顔モデルを作成し,複数の顔候補を選ぶ.モザイク法では,候補から一つに絞れないため,候補の特徴空間への射影から再構成したパターンとの距離で顔らしさを評価する方式を考案した.選ばれた候補領域の近傍を顔特徴パターンに基づいて探索し,正確な顔領域を抽出する.実験により,顔領域発見,表情認識の自動化に成功した.
|