研究概要 |
本年度は,昨年度までに行った,PHMMの一般化(GPHMM : Generalized Partly-Hidden Markov Model)に関する研究の成果を基礎として,連続音声認識への拡張と,HMMとのハイブリッド化に関する検討を行い,次のような成果を得た。 1)GPHMMの連続音声認識による評価 音響モデルの構成単位として半音節モデルを導入し,本研究室で開発したワンパストライグラムデコーダを用いてGPHMMの連続音声認識による評価を行なった.その結果,HMM,従来のPHMM,平滑化PHMMを上回る性能が得られた.HMMに対する誤認識の改善率は,12%となった。 2)平滑化GPHMMの連続音声認識による評価 GPHMMの確率をHMMの確率で補間・平滑化した平滑化GPHMM提案し,その性能を連続音声認識により評価した.SPHMMはGPHMMの誤りを16%改善し,HMMの誤りを25%改善した。 通常,最尤法を用いて学習した確率モデルは,正解カテゴリに対し低い尤度を与えるわけではなく,非正解カテゴリに対し高い尤度を与えこれが誤認識の原因となる。SPHMMは,GPHMMとHMMが共に高いスコアを与えた単語仮説のみを正解とする粋組みとなっており,たまたま片方のモデルで高いスコアを与えた非正解カテゴリを候補から排除できる。このことが有効に機能して高い性能が得られたものと考えられる。 以上のような一連の成果により,状態・出力に相互依存性を有する確率モデルという従来にない枠組みの下で,高精度な音声・ジェスチャ認識が実現できた。
|