Research Abstract |
本研究では,人物の1枚の正面顔の画像から,その4表情(幸福,悲しみ,怒り,驚き)の識別をコンピュータが行うことを目的とする.特に,任意の拝啓にたいして顔を画面から切り出し,その表情を認識することに重点を置く. 従来の表情認識の手法は,眉,目,口などの顔の機関を検出し,その幾何学的パラメータ,相互関係,時間的変化などを解析し,認識を行った.しかし,人間は顔全体のパターンを捉えて表情認知を行うと考えられる.本研究は,人間の認知と深く関わっているポテンシャル場の方式を拡張し,全体パターンから表情認識を行う.本年度では,人間の正面顔部分が抽出されたと仮定し,顔をカバーする領域にエッジの強さに比例するポテンシャル場とグリッドを想定する.グリッドの各ノードは隣接ノードにスプリングで接続されている.ポテンシャル場からの力とスプリングの力がバランスするようにノードが移動した時,各ノードの移動量を特徴ベクトルと考え,画像パターンをノード数の次元の特徴ベクトルで表現する.多くの被験者の4表情に対する特徴ベクトルを算出し,各表情に対するモデルを決定する.入力画像の特徴ベクトルとモデルとの距離で表情を分類する.次元が高いため,KL展開により処理を効率化する.多くの画像に対して実験を行い,有効性を確かめた. 上述した方法を適用するには,顔領域を正しく検出する必要がある.顔の共通モデルとして,ポテンシャル場から得られた特徴ベクトルを利用する方式を提案し,予備実験を行って問題点を検討した.また,計算量削減のために,粗い処理と精密な位置決めを組み合わせる方式を提案した.
|