研究課題/領域番号 |
63550253
|
研究機関 | 名古屋工業大学 |
研究代表者 |
北村 正 名古屋工業大学, 工学部, 助教授 (60114865)
|
研究分担者 |
早原 悦朗 名古屋工業大学, 工学部, 教授 (80024214)
山田 由之 名古屋工業大学, 工学部, 助手 (50024253)
|
キーワード | 2次元メルケプストラム / 雑音下での音声認識 / 人間の聴覚特性 / メル周波数 / スペクトルの時間変化情報 |
研究概要 |
本研究では計算機シミュレーションによる白色雑音と名古屋駅で収集した実環境の雑音を用いて、日本語十数字音声を対象にして特定話者の単語音声認識を行った。認識手法は我々が提案した2次元メルケプストラムを用いる認識法である。2次元メルケプストラムは人間の聴覚特性を十分考慮した音声の特徴パラメータであり、分析区間内の音声のスペクトルの平均的な特徴とその変化情報である動的特徴を持っている。本研究において、本年度得られた研究成果は以下の通りである。 1.2次元メルケプストラムを用いる音声の分析合成系の構成及び評価: 2次元メルケプストラムを用いる音声の分析合成系を構成法を示し、合成音声の品質から音声合成に必要な2次元メルケプストラムの特徴領域を検討した。この結果を基にして単音節認識に必要な2次元メルケプストラムの特徴領域を検討した。(以上論文発表) 2.雑音のSN比の変動に強い参照パターンの作成法の検討: 認識時に用いる参照パターンに時間領域で参照を付加し、2次元メルケプストラムで表現した参照パターンを利用することにより、雑音のSN比の変動に強い参照パターンを得ることができることを明らかにした。また、単語音声の認識に必要な2次元メルケプストラムの領域を検討した。更に、参照雑音の平均的なスペクトルを参照パターンのスペクトルに付加する事により認識率の向上が可能であることを示した。(以上論文発表) 3.雑音のSN比の変動に強い認識距離尺度の検討: 単語音声の平均的特徴より動的特徴を重要視した距離尺度を提案し、従来の1次元的な分析法に比べ本方法が特にSN比の低い低品質の単語音声に有効であることを示した。更に、適当なリフタリング操作により認識率の向上が可能となることを明らかにした。(以上論文発表)
|