研究概要 |
1.研究の目的 大語彙・連続音声を対象とした本格的な音声認識を現実的な時間内で実行可能となるように、種々の知識を駆使して処理量をドラスティックに削減するためのStrategyを確立し、認識アルゴリズムをより高度化する. 2.研究内容 今年度は、フレ-ム同期DPマッチングにビ-ムサ-チを導入して計算量低減をはかる音声認識(DPビ-ムサ-チという)の高度化に関して、以下の項目について研究した. (1)前年度に研究した格子点枝刈の閾値関数設定法に加えて,枝刈判定のさい同じ標準パタ-ンに属する格子点の数に制限を設けて、格子点を必要以上に残すことの無駄をさらに少なくする方法. (2)VQ歪に基づく単語予備選択の手法を利用し、DPビ-ムサ-チによる格子点枝刈にもその手法を有機的に組み込んで、計算量低減の効果を高める認識方式. 3.研究成果 単語音声認識実験により、DPビ-ムサ-チによる音声認識アルゴリズムの高度化に関して、次のことが明らかになった. (1)同じ標準パタ-ンに属する格子点の数に制限を設けるとき、ビ-ム内に残る格子点はその累積距離の値とDP領域における位置の双方をバランスよく考慮して選択することが望ましい. (2)単語予備選択を入力フレ-ムに同期して行うと、従来のように入力の最終フレ-ムでのみ単語予備選択を行うのに比べて、符号帳サイズが大きくなるにつれて、VQ距離計算量低減の効果が顕著になる. (3)格子点枝刈の判定において、「DP累積距離」の他に「VQ累積歪」も考慮することが望ましい.
|