研究概要 |
あいまいな特徴を表す言葉で顔画像検索を行うことを目的として,顔画像の自動特徴抽出についての研究と,3層ニューラルネットワークによる顔画像検索システム作成のための基礎的研究を行った. 顔画像の自動特徴抽出では,開眼と閉眼の2枚の顔画像の差分画像と部分的パターンマッチングによりまず目の位置を決定し,これを元に口,鼻等他の部分の抽出を行った.2枚の画像間に多少のづれがあっても,約85%で目の検出を行うことができ,目が検出できた画像では口や鼻の検出をほぼ完全に行うことができた. 顔画像検索では,約50名の正面顔画像データを標準・幸福・驚き・嫌悪の4表情ずつ写真で収集し,これらの顔画像をスプリングフレームによりモデル化した.さらに,平均的な特徴を持つ顔モデルを生成し,個々の顔のモデルの偏差により顔の物理的な特徴を記述した.また,収集した顔画像について,物理的特徴を表す言葉と,感性的・感覚的特徴を表す言葉,45項目について評価アンケートを実施した.以上で求めた顔の物理特徴量を入力,アンケートの回答を目標関数とした学習を行い,学習に用いなかった顔を入力した時の出力とアンケート結果との比較による評価実験を行った.その結果,物理的特徴を表す言葉については,アンケート結果とほぼ一致した出力が得られ,本方式の有効性が確認できたが,感性的・感覚的特徴を表す言葉では,全く反対の出力となるものもあり不安定であった.顔画像検索に用いる印象語には,1つの顔についてのアンケート結果の分散は小さく,異なる顔間ではアンケート結果のばらつきが大きくなるものが望ましいと考えられるが,実際には標準的あるいは好意的な印象に回答が片寄る傾向が見られたため,目標関数の設定方法について,更に検討が必要と思われる.また,今回のワイヤーフレームモデルでは表現しきれなかった顔の特徴についても,検討が必要である.
|