研究概要 |
(1)隠れマルコフモデルに基づいて音声を合成するために,音声パラメータの動的特徴を利用した隠れマルコフモデルからの音声パラメータ生成法を提案した. (2)そのための高速計算アルゴリズムを導出し,実時間での音声合成を可能とした. (3)音声データベースによって,隠れマルコフモデルの学習を行ない,受聴試験に基づく主観評価によって,動的特徴を考慮することにより,自然で滑らかな音声を合成できることを示した. (4)種々の条件で隠れマルコフモデルの学習を行ない,得られた隠れマルコフモデルから音声を合成し,合成に適した隠れマルコフモデルの構成法について検討した. (5)受聴試験に基づく主観評価によって,隠れマルコフモデルの構造や学習法を検討した.その結果,概ね音声認識と同様の観点から,隠れマルコフモデルの構造や学習法を設定すればよいことがわかった.但し,通常の音声認識と異なり,状態継続長のモデルは音声認識で用いられるものより精密なものにする必要があることもわかった. (6)得られた隠れマルコフモデルに話者適応の技術を適用することにより多様な声質の音声を合成できることを確かめた. (7)今後は以上の結果を元に,自在に感情を表現することのできる音声合成システムを実現することを予定している.
|