今年度は、画像系列から口の3次元形状を復元する手法の開発、ならびに発語認識に利用する低次元特徴量の検討とその有効性の実験的評価を行なった。 まず前者については、モアレトポグラフィ技術によって得られる1自由度(奥行き方向の伸縮)不定の奥行き情報の不定パラメータ(絶対縞次数)を変化させながら、簡単な表面反射モデルを仮定することによってその形状に対するCG画像を作成し、実際に計測されている画像と合わせこむことによって上記不定パラメータを決定する手法を開発した。その際、当初購入を予定していた「3次元形状計測システム」では時間的に変化する形状を扱うことができないため、その購入を断念し、シミュレーションによって提案法の精度評価を行なうこととした。画像雑音が白色である場合は本手法は理論的には最尤推定を行なうことに相当しており、このシミュレーション評価によって、得られる推定量には実際に統計的偏りが存在しないことを確認した。 後者については、従来の2次元画像を用いた発語認識手法に対して3次元情報を用いることの有効性を確認するという意味で、そのような従来法で用いられていた2つの特徴量、「口の縦横の開き具合い」と「唇周辺の2次元的変位場」、を3次元に拡張し、「口の縦横の開き具合い唇の突き出し具合い」と「唇周辺の3次元的変位場」を特徴量とすることの有効性を評価した。発語認識手法としては、従来提案されている単語レベルでの固有空間に基づく手法を採用し、両特徴量について実画像に対する実験を行なったところ、両者において認識率の明らかな向上が確認された。なお、購入した「ディジタルビデオ」の使用により、これまで使用していた「8ミリビデオ」で採取・再生した画像に見られた雑音が大幅に低減され、実験の信頼性を高めることができた。
|