2001 Fiscal Year Annual Research Report
Project/Area Number |
12680380
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
北村 正 名古屋工業大学, 工学部, 教授 (60114865)
|
Co-Investigator(Kenkyū-buntansha) |
宮島 千代美 名古屋工業大学, 工学部, 助手 (90335092)
益子 貴史 東京工業大学, 大学院・総合理工学研究科, 助手 (90272715)
小林 隆夫 東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)
|
Keywords | 固有声 / 隠れマルコフモデル / 声質変換 / スペクトル包絡 / 基本周波数 / 多空間分布HMM / 音声合成 / メルケプストラム |
Research Abstract |
隠れマルコフモデル(HMM)に基づく音声合成システムでは,HMMのパラメータを変換することで様々な声質の音声を合成できるという利点がある。本研究では,固有声手法をHMM音声合成システムに適用することにより,多様な声質の合成音声を得ることが出来るシステムを提案しその有効性を示してきた。昨年度までのシステムではtriphoneモデルに固有声手法を適用してきたが,スペクトルのみを扱っていた。本年度は,更に基本周波数をも同時にモデル化するため,多空間分布HMMによって基本周波数をモデル化した。また,不特定話者モデルのクラスタリングの際に,MDL基準を用いた。2種類のモデル生成部を提案し,それぞれについて合成実験を行った。実際に1から3個の固有ベクトルの重みを変更して聴取実験を行った。スペクトル包絡の面では,男性的,女性的な合成音声を,基本周波数の面では,高い,低い合成音声などの声質を持つ音声を容易に合成することが出来た。 また,提案法の基になっているHMM音声合成システムの合成音声の品質向上のための検討をも行った。従来のシステムでは,励振源モデルとして有声区間と無声区間でパルス列と白色雑音源を切り換える単純なモデルを用いていたため,合成音声はボコーダ特有の品質であった。研究では,音声符号化手法であるMELPと同様の混合励振源モデルとポストフィルタを導入することにより合成音声の品質向上を検討した。合成音声の聴取実験によれば,品質が大幅に改善できることが確認できた。 以上の成果は,電子情報通信学会研究会,日本音響学会秋季発表会,Eurospeech2001において発表を行った。
|
Research Products
(5 results)
-
[Publications] 沢辺, 七里, 吉村, 徳田, 北村, 益子, 小林: "固有声手法に基づく音声合成におけるピッチのモデル化"日本音響学会2001年秋季研究発表会 講演論文集. I. 315-316 (2001)
-
[Publications] 吉村, 徳田, 益子, 小林, 北村: "HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入"電子情報通信学会音声研究会資料. SP2001-63. 17-22 (2001)
-
[Publications] 沢辺, 七里, 吉村, 徳田, 益子, 小林, 北村: "HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用"電子情報通信学会音声研究会資料. SP2001-72. 65-72 (2001)
-
[Publications] Yoshimura, Masuko, Tokuda, Kobayashi, Kitamura: "Mixed Excitation for HMM-based Speech Synthesis"Proceedings of EUROSPEECH2001. 779-782 (2001)
-
[Publications] 吉村, 徳田, 益子, 小林, 北村: "HMMに基づく音声合成における品質改善に関する検討"日本音響学会2001年秋季研究発表会 講演論文集. I. 371-372 (2001)