1989 Fiscal Year Annual Research Report
2次元メルケプストラムを用いる雑音下の単語音声認識
Project/Area Number |
63550253
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
北村 正 名古屋工業大学, 工学部, 助教授 (60114865)
|
Keywords | 2次元メルケプストラム / メルケプストラム / スペクトルの動的特徴 / 白色雑音 / 有色雑音 / 数字音声 |
Research Abstract |
本年度は、計算機シミュレ-ションによる白色雑音と名古屋駅で収集した実環境の雑音を用いて、特定話者及び不特定話者の数字音声認識を行った。認識手法は我々が提案した参照パタ-ンを用いる方法及び2次元メルケプストラムを用いる認識法である。2次元メルケプストラムは人間の聴覚特性を十分考慮した音声の特徴パラメ-タであり、分析区間内の音声のスペクトルの平均的な特徴とその時間変化情報である動的特徴を同時に表すことが出来る。本研究において、本年度に得られた研究成果は以下の通りである。 1.認識に必要な2次元メルケプストラムの領域の詳細な検討: 音声の動的特徴を表す2次元メルケプストラムの領域を変化させ、静的な特徴との最適な組合せについて検討を行った。その結果、時間方向のスペクトルの変化情報は10Hz以下の成分を用いればよいこと及び静的特徴より動的特徴がより重要であることが明らかとなった。(論文発表) 2.2次元メルケプストラムを用いた不特定話者の雑音下の数字音声認識: 登録していない話者に対しての雑音下での数字音声認識(不特定話者認識)を検討し、特定話者の場合と同様にスペクトルの動的特徴が認識に有効であることを明らかにした。(論文発表) 3.参照パタ-ンのマルチテンプレ-ト化による雑音下での数字音声認識: 1次元メルケプストラムを用いて雑音下での認識に適した参照パタ-ンを作成し、SN比の異なる複数の参照パタ-ンを用いて認識実験を行った。その結果、SN比の異なる2組みの参照パタ-ン(10、3dB)を用いれば、名古屋駅で採集した雑音に対して入力音声のSN比が0dBまで変化しても96%以上の認識率が得られることを明らかにした。(論文発表)今後は、これを2次元メルケプストラムに適用する予定である。
|
-
[Publications] 北村正、水谷忠司: "スペクトル変化を利用する雑音下の数字音声認識" 日本音響学会平成元年度春季研究発表会講演論文集. 平1ー03. 113-114 (1989)
-
[Publications] 北村正、片柳恵一: "2次元メルケプストラムの静的特徴・動的特徴を用いる数字音声認識" 電子情報通信学会論文誌(A). J72ーA. 640-647 (1989)
-
[Publications] 北村正,早原悦朗: "2次元メルケプストラムの動的特徴を利用する雑音下での特定話者数字音声認識" 電子情報通信学会論文誌(D). J72ーDーII. 1242-1247 (1989)
-
[Publications] 嶋崎靖彦、北村正: "雑音下における不特定話者の数字音声認識" 平成元年度電気関係学会東海支部連合大会講演論文集. 平1ー10. 422 (1989)
-
[Publications] 北村正、水谷忠司: "マルチテンプレ-トを用いる雑音下での数字音声認識" 日本音響学会平成元年度秋季研究発表会講演論文集. 平1ー10. 65-66 (1989)
-
[Publications] 北村正,嶋崎靖彦: "スペクトルの動的特徴を用いる雑音下での不特定話者数字音声認識" 日本音響学会平成2年度春季研究発表会講演論文集. 平2ー03. 5-6 (1990)