1988 Fiscal Year Annual Research Report
2次元メルケプストラムを用いる雑音下での単語音声認識
Project/Area Number |
63550253
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
北村 正 名古屋工業大学, 工学部, 助教授 (60114865)
|
Co-Investigator(Kenkyū-buntansha) |
早原 悦朗 名古屋工業大学, 工学部, 教授 (80024214)
山田 由之 名古屋工業大学, 工学部, 助手 (50024253)
|
Keywords | 2次元メルケプストラム / 雑音下での音声認識 / 人間の聴覚特性 / メル周波数 / スペクトルの時間変化情報 |
Research Abstract |
本研究では計算機シミュレーションによる白色雑音と名古屋駅で収集した実環境の雑音を用いて、日本語十数字音声を対象にして特定話者の単語音声認識を行った。認識手法は我々が提案した2次元メルケプストラムを用いる認識法である。2次元メルケプストラムは人間の聴覚特性を十分考慮した音声の特徴パラメータであり、分析区間内の音声のスペクトルの平均的な特徴とその変化情報である動的特徴を持っている。本研究において、本年度得られた研究成果は以下の通りである。 1.2次元メルケプストラムを用いる音声の分析合成系の構成及び評価: 2次元メルケプストラムを用いる音声の分析合成系を構成法を示し、合成音声の品質から音声合成に必要な2次元メルケプストラムの特徴領域を検討した。この結果を基にして単音節認識に必要な2次元メルケプストラムの特徴領域を検討した。(以上論文発表) 2.雑音のSN比の変動に強い参照パターンの作成法の検討: 認識時に用いる参照パターンに時間領域で参照を付加し、2次元メルケプストラムで表現した参照パターンを利用することにより、雑音のSN比の変動に強い参照パターンを得ることができることを明らかにした。また、単語音声の認識に必要な2次元メルケプストラムの領域を検討した。更に、参照雑音の平均的なスペクトルを参照パターンのスペクトルに付加する事により認識率の向上が可能であることを示した。(以上論文発表) 3.雑音のSN比の変動に強い認識距離尺度の検討: 単語音声の平均的特徴より動的特徴を重要視した距離尺度を提案し、従来の1次元的な分析法に比べ本方法が特にSN比の低い低品質の単語音声に有効であることを示した。更に、適当なリフタリング操作により認識率の向上が可能となることを明らかにした。(以上論文発表)
|
-
[Publications] 北村正: 日本音響学会昭和63年度秋期研究発表会講演論文集. 昭63ー10. 59-60 (1988)
-
[Publications] 浅村吉範: 電子情報通信学会音声研究会資料. SP88ー47. 17-24 (1988)
-
[Publications] 水谷忠司: 電子情報通信学会音声研究会資料. SP88ー121. 39-45 (1989)
-
[Publications] 浅村吉範: 電子情報通信学会音声研究会資料. SP88ー127. 41-48 (1989)
-
[Publications] 北村正: 日本音響学会平成元年度度春期研究発表会講演論文集. 平成1ー03. 3-4 (1989)
-
[Publications] 北村正: 電子情報通信学会1989年春期全国大会. 平成1ー03. A-23 (1989)