1996 Fiscal Year Annual Research Report
隠れマルコフモデルを用いた認識ボコーダー極低ビットレート音声符号化-
Project/Area Number |
08780333
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
徳田 恵一 名古屋工業大学, 工学部, 助教授 (20217483)
|
Keywords | 音声認識ボコーダ / 隠れマルコフモデル / 音声符号化 / 極低ビットレート音声符号化 |
Research Abstract |
(1)音声合成及び音声認識に適した隠れマルコフモデルの単位や構造について検討を行った.その結果,概して音声認識率の良いモデルが,合成音声の品質もよいことがわかった.但し,継続長は,モデルがもつ継続長ではなく,認識時に得られた継続長を用いて音声合成を行う必要があることもわかった. (2)受聴試験に基づく主観評価実験により,提案符号化システムの音声品質評価を行なった.その結果,通常用いられるベクトル量子化法に比べて,約半分のビットレート(約200bit/s)で音声スペクトル情報を符号化したにも関わらず,大きく音声品質を改善できることがわかった(MOS値で約0.3の改善). (3)異なる話者に対応するため,音声認識における話者適応の手法を導入することを検討した.その結果,男性話者間の適応は,良好に行うことができるが,男性話者から女性話者、あるいはその逆の適応は,若干精度が悪くなることもわかった. (4)上記問題に対応するため,代表話者何人かの隠れマルコフモデルを用意し、それらを補間する方法について検討を行い,男性話者と女性話者の間の補間も良好に行われることを確認した.
|
Research Products
(6 results)
-
[Publications] 益子貴史: "動的特徴を用いたHMMに基づく音声合成" 電子情報通信学会論文誌. J79-D-II,12. 2184-2190 (1997)
-
[Publications] 徳田恵一: "動的特徴を用いたHMMからの音声パラメータ生成アルゴリズム" 日本音響学会誌. 53,3(採録決定済). (1997)
-
[Publications] Takashi Masuko: "Speech synthesis from HMMs using dynamic features" Proceedings of International Conference on Acoustics,Speech,and Signal Processing. 1. 389-392 (1996)
-
[Publications] Takashi Masuko: "HMM-based speech synthesis with various voice characteristics" Proceedings of Joint ASA/ASJ Meeting. 1043-1046 (1996)
-
[Publications] Takashi Masuko: "Voice characteristics conversion for HMM-based speech synthesis system" Proceedings of International Conference on Acoustics,Speech,and Signal Processing. (採録決定済). (1997)
-
[Publications] 益子貴史: "HMMに基づく音声合成における話者適応による声質変換" 日本音響学会平成9年度春季研究発表会講演論文集. 1. 267-268 (1997)