研究概要 |
本研究の目的は,背景雑音が存在する環境で観測された音声信号に対し,雑音成分の影響を除去した音声信号の対数スペクトルを推定する新たな手法を確立し,さらに,提案手法を雑音環境下での単語音声認識における認識パラメータ推定法として応用した際の有効性を検討することにあった. まず,音声信号を表わすスペクトルモデルとして,ケプストラムをパラメータとする指数関数型の最小位相モデルを仮定し,これに事後確率最大法を適用してパラメータ推定の定式化を行った.その結果,提案するスペクトル推定法がウィナーフィルタリングと対数スペクトルの不偏推定法の繰り返しに帰着されることを示し,その処理アルゴリズムを確立した.また,一般化ケプストラムモデルへの拡張に関しても考察を行った.さらに,前述のアルゴリズムをワークステーション上の処理システムとして実現し,雑音を付加した音声信号を用いて音声強調実験を行った.雑音として白色雑音を用いた場合,従来の全極モデルに基づく手法と比較して,無声子音部で強調音声のSN比が向上すること,強調音声の聴取試験結果ではミュージカルノイズが減少すること等の事実を明かにした. 次に,提案する手法の応用として,得られたケプストラムを認識パラメータに用い,雑音を付加した単語音声を対象とした音声認識実験を行った.男女各1名の特定話者による100都市名の認識結果では,従来の全極モデルに基づく手法に比較して,SN比が-5〜20dBの広い範囲で認識率が向上することが確かめられた.
|