1992 Fiscal Year Annual Research Report
雑音環境下における音声の対数スペクトル推定と耐雑音性音声認識への応用
Project/Area Number |
04650277
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
小林 隆夫 東京工業大学, 精密工学研究所, 助教授 (70153616)
|
Keywords | 音声強調 / ケプストラム / スペクトル推定 / 事後確率最大法 / 雑音音声認識 / 対数スペクトルの不偏推定 |
Research Abstract |
本研究の目的は,背景雑音が存在する環境で観測された音声信号に対し,雑音成分の影響を除去した音声信号の対数スペクトルを推定する新たな手法を確立し,さらに,提案手法を雑音環境下での単語音声認識における認識パラメータ推定法として応用した際の有効性を検討することにあった. まず,音声信号を表わすスペクトルモデルとして,ケプストラムをパラメータとする指数関数型の最小位相モデルを仮定し,これに事後確率最大法を適用してパラメータ推定の定式化を行った.その結果,提案するスペクトル推定法がウィナーフィルタリングと対数スペクトルの不偏推定法の繰り返しに帰着されることを示し,その処理アルゴリズムを確立した.また,一般化ケプストラムモデルへの拡張に関しても考察を行った.さらに,前述のアルゴリズムをワークステーション上の処理システムとして実現し,雑音を付加した音声信号を用いて音声強調実験を行った.雑音として白色雑音を用いた場合,従来の全極モデルに基づく手法と比較して,無声子音部で強調音声のSN比が向上すること,強調音声の聴取試験結果ではミュージカルノイズが減少すること等の事実を明かにした. 次に,提案する手法の応用として,得られたケプストラムを認識パラメータに用い,雑音を付加した単語音声を対象とした音声認識実験を行った.男女各1名の特定話者による100都市名の認識結果では,従来の全極モデルに基づく手法に比較して,SN比が-5〜20dBの広い範囲で認識率が向上することが確かめられた.
|
-
[Publications] 小林 隆夫: "雑音が付加された音声の対数スペクトル推定" 1992年電子情報通信学会秋季大会講演論文集. 1. 110-110 (1992)
-
[Publications] 菅野 俊夫: "雑音環境下における音声の対数スペクトル推定" 日本音響学会平成4年度秋季研究発表会講演論文集. 1. 301-302 (1992)
-
[Publications] 菅野 俊夫: "Speech Enhancement Using Generalize Cepstral Model" 第7回ディジタル信号処理シンポジウム講演論文集. 85-90 (1992)
-
[Publications] 菅野 俊夫: "一般化ケプストラムモデルに基づく雑音環境下の音声のスペクトル推定" 日本音響学会平成5年度春季研究発表会講演論文集. 1. 261-262 (1993)