2008 Fiscal Year Annual Research Report
統計的アプローチによる画像変動に頑健なモデル構造の探求
Project/Area Number |
19700165
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
南角 吉彦 Nagoya Institute of Technology, 工学研究科, 助教 (80397497)
|
Keywords | 画像認識 / 統計モデル / 隠れマルコフモデル |
Research Abstract |
近年のコンピュータの普及により, 人間と同様の手段でコミュニケーションのできる視覚・聴覚情報を用いたインターフェイスの開発が期待されている. また, 音声認識や画像認識は, その重要な要素技術であり, 盛んに研究が行われている. しかし, 音声認識では, 隠れマルコフモデル(HMM)に基づく手法が確立されつつあるのに対し, 画像認識では, 認識対象が多さとデータの複雑さから様々な手法が乱立している状態である. 本研究では, 顔画像認識, 文字認識, ジェスチャ・手話認識リップリーディングなどの様々な画像に適用可能な汎用的な統計モデルを考え, 音声認識におけるHMMのような画像認識のためのスタンダードな統計モデルの構築を目指し研究を行なっている. 本年度の研究では, これまでに提案した分離型格子HMMを拡張し, 画像の位置や大きさだけでなく, 回転変動に対応可能なモデル構造を提案し, その学習アルゴリズムを導出した. さらに, 学習アルゴリズムの改良として, 確定的アニーリングに基づくアルゴリズムを導出した. また, 隠れマルコフモデルの問題点である状態遷移確率の脆弱性を解消するため, 状態継続長を組み込んだモデルを提案した. これらの拡張により, 提案モデルは多様な画像変動を適切か表現することが可能となり, 画像認識において画像変動による認識率の低下を削減することが可能となった. 評価実験として顔画像データを用いた認識実験を行い, 提案手法の有効性を確認した.
|
Research Products
(2 results)