研究概要 |
ベクトル量子化コードブック空間情報処理と呼ぶ新しい情報処理アルゴリズムによる顔画像人物認識技術を開発した。具体的には,顔画像を4×4画素程度のブロックに分割した後,ブロック内の最小輝度を減算して差分信号を抽出し,理論的手法で構成したコードブックを用いてベクトル量子化し,コードブックベクトルの使用頻度(ヒストグラム)を特徴量としてデータベースとマッチングを行い認識する手法である。画像に含まれる雑音成分を除去すると共に顔画像人物認識に必要な周波数成分を抽出するための平均値フィルタ処理,顔画像の大きさによる影響を除外するためのヒストグラム規格化処理を開発した。また,認識率に替わる認識性能評価指針として有効認識距離の概念を導入し,高認識率領域における認識アルゴリズムの更なる高性能化の研究に用いた。最終的に,44人分各5枚の合計220枚の顔写真を用いた認識実験において,100%の認識率を実現した。 さらに,ベクトル量子化コードブック空間情報処理による人物顔画像認識技術を,表情認識に適用した。認識対象とする人物を限定し,怒り,笑い,標準の3種類の表情を認識する実験を行ったところ,100%の表情認識結果が得られた。最適フィルタサイズ,最適画像解像度の検討から,表情認識には,顔面上寸法で13mm〜14mm以上の信号周期を持った信号成分が重要であることが明らかになった。 また,将来的に極めて正確な人物認識,認証を実現する為に,顔認識と同様にコードブック情報処理を用いた話者認識の研究を行い,ケプストラム解析を用いた音声信号からの話者特徴抽出とベクトル量子化分類法により個人を認識する音声話者認識技術を開発した。階層化マッチング手法によるベクトル量子化分類の高速化や前学習手法による認識率の向上を実現した。58人分各5回分の録音音声信号を用いた認識実験において,最大97%の認識率を実現した。
|