研究概要 |
本研究では、従来の認識手法と異なる新しいベクトル量子化コードブック空間情報処理による物体特徴抽出手法を開発した.その具体例として顔検出において、分離度フィルタとVQヒストグラム法を用いて高精度目の検出アルゴリズムを提案した.カラーの顔画像に対して,まずHS肌色モデルと形状情報で顔候補を選出する.次に福井らの分離度フィルタを適用し,瞳の候補を抽出し,位置関係で可能な両目の候補を選出する.両目を含む画像部分をアフィン変換したあと,目のテンプレート間との正規化相関関数,それぞれ対応するVQヒストグラム間の類似度と分離度の組み合わせで総合類似度を計算する.最も類似度の高い目のペアを両目の瞳とする.公開ARデータベースの21人分63枚のメガネをかけていない顔画像に対して,98.4%の検出率を実現した.両目検出アルゴリズムはANSICでプログラミングされ,ノートPC (Pentium IV 2GHz)上で実行される.検出時間については,ARデータベースの一枚入力画像の検出処理は約0.6secがかかる. この高精度目の検出アルゴリズムをさらに検討し、精度を高めて、認識速度をアップするようにするためには、矩形の分離度フィルタを導入した.分離度の計算は積分画像を利用することにより、高速に計算できた.実験結果により、検出精度がほぼ一定に保てながら、検出速度が倍ぐらいに向上させた.そして、実際の検出システムを組んで、その実環境での有効性を検討した. また、ベクトル量子化コードブック空間処理を用いる物体認識手法の中に、非常に重要な役割を果たしているコードブックの構成を検討し、認識率の向上を図った.コードブックは認識精度と認識スピードに大きな影響を与える,そこで、ここまで使われてきた4x4のコードパターンを2x2に変えて検討した.2x2画素ブロックのすべての変化パターンは回転、上下反転、左右反転、アルファベットの入れ替え処理により11種類の基本カテゴリーに分類できる.パターン分析により理論的なコードブックを作成することが可能である.検討した結果、全部169個パターンの2x2コードブックを生成した.実験結果により、AT&Tデータベースの平均認識率の比較結果で、従来の4x4のコードパターンを用いたアルゴリズムは最大平均認識率95.7%であるが,2x2コードブック補正した後,97.4%の最大平均認識率が得られた.
|