Forward-Backward探索アルゴリズムに基づく双方向探索型の音声認識プログラムを用いて、さまざまな探索条件のもとでの評価実験を行った。認識実験では、評価音声データとしATR自動翻訳電話研究所発行の研究用日本語音声データベースに収録されている音声データを用いた。この音声データをサンプリング周波数12kHz、窓長21.3ms、周期9msのハミング窓をかけた後、12次のLPC分析を行い、スペクトル(WLR)、ケストラム係数の差分(差分CEP)、PWLR距離尺度中のパワー項(POW)の3種類の特徴量を抽出した。また、HMMは離散型出力確率分布を持つ音韻モデルを用い、継続時間長制御なし、子音3状態、母音1状態とした。 認識実験においては、まず後向き方向に認識を行い各フレーム毎に有限オートマトンの状態番号と、その状態番号における尤度を保存し、保存した情報を用いて前向き方向に有限オートマトン制約あるいは文脈自由文法制約による探索を行った。文脈自由文法制約による探索では、文脈自由文法をLR構文解析表に展開し、LR構文解析表の状態番号と有限オートマトンの状態の対応付けを行うことにより、認識仮説の接続可能性チェックを行った。 各種探索条件による認識率を下に示す。下記の実験結果より、双方向型探索を用いることにより、認識率の向上をはかることができた。 (a)前向き探索のみで有限オートマトン制約を使った場合:87.3% (b)後向き探索のみで有限オートマトン制約を使った場合:77.1% (c)前向き・後向き探索ともに有限オートマトン制約を使った場合:87.5% (d)前向き探索に文脈自由文法を後向き探索に有限オートマトン制約を使った場合:88.6%
|