研究概要 |
隠れマルコフモデル(HMM)に基づく音声合成システムでは,HMMのパラメータを変換することで様々な声質の音声を合成できるという利点がある。本研究では,固有声手法をHMM音声合成システムに適用することにより,多様な声質の合成音声を得ることが出来るシステムを提案しその有効性を示してきた。昨年度までのシステムではtriphoneモデルに固有声手法を適用してきたが,スペクトルのみを扱っていた。本年度は,更に基本周波数をも同時にモデル化するため,多空間分布HMMによって基本周波数をモデル化した。また,不特定話者モデルのクラスタリングの際に,MDL基準を用いた。2種類のモデル生成部を提案し,それぞれについて合成実験を行った。実際に1から3個の固有ベクトルの重みを変更して聴取実験を行った。スペクトル包絡の面では,男性的,女性的な合成音声を,基本周波数の面では,高い,低い合成音声などの声質を持つ音声を容易に合成することが出来た。 また,提案法の基になっているHMM音声合成システムの合成音声の品質向上のための検討をも行った。従来のシステムでは,励振源モデルとして有声区間と無声区間でパルス列と白色雑音源を切り換える単純なモデルを用いていたため,合成音声はボコーダ特有の品質であった。研究では,音声符号化手法であるMELPと同様の混合励振源モデルとポストフィルタを導入することにより合成音声の品質向上を検討した。合成音声の聴取実験によれば,品質が大幅に改善できることが確認できた。 以上の成果は,電子情報通信学会研究会,日本音響学会秋季発表会,Eurospeech2001において発表を行った。
|