研究概要 |
平成9年は高速に正確な唇形状を抽出するために新しい動的輪郭モデルを考案した.このモデルに基づくシステムを構築した結果,本計画で初年度に目標としていた唇形状の抽出を行うことはほぼ達成できた.つづいて実時間処理が可能な手法として開発したシステムを動画像へ適用するため,基礎的な実験を行った結果ほぼ満足する結果が得られた. 唇の形状抽出について当初は唇の外側の輪郭だけを使って認識ができるものと考えていたが,初年度に行った予備的実験の結果,外側だけでなく唇の内側の形状を利用することで認識率の向上が望めることが分かった.唇の内側の形状を抽出することは唇の部分の色の変化に伴う雑音が多く発生し,外側の形状を抽出するのに比べ困難であると思われるが,動的輪郭モデルの改良,2値化処理の改良などを行うことで解決を図ることを検討している. 音声についての認識方法としてHMM(Hidden Markov Model)に基づく方法を検討した.そして認識のために必要となる,実時間での音声の取り込み,ケプストラムの計算,クラスタリングおよびHMMによる認識を行うためのプログラムの開発を行った.初年度でこれらのプログラムの開発はほぼ完了し,今後は認識実験を行いながら各パラメータの設定について検討をして行くことが残されている. 第2年度には初年度得られた研究成果を元に,音声データと画像情報を組み合わせることにより正確な音声認識システムの構築を目指す.この作業は実際に雑音下での音声データを取り込み,実験を行いながらシステムの構築を行う必要がある.
|