• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2001 年度 実績報告書

固有声(eigenvoice)に基づいた音声合成

研究課題

研究課題/領域番号 12680380
研究機関名古屋工業大学

研究代表者

北村 正  名古屋工業大学, 工学部, 教授 (60114865)

研究分担者 宮島 千代美  名古屋工業大学, 工学部, 助手 (90335092)
益子 貴史  東京工業大学, 大学院・総合理工学研究科, 助手 (90272715)
小林 隆夫  東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)
キーワード固有声 / 隠れマルコフモデル / 声質変換 / スペクトル包絡 / 基本周波数 / 多空間分布HMM / 音声合成 / メルケプストラム
研究概要

隠れマルコフモデル(HMM)に基づく音声合成システムでは,HMMのパラメータを変換することで様々な声質の音声を合成できるという利点がある。本研究では,固有声手法をHMM音声合成システムに適用することにより,多様な声質の合成音声を得ることが出来るシステムを提案しその有効性を示してきた。昨年度までのシステムではtriphoneモデルに固有声手法を適用してきたが,スペクトルのみを扱っていた。本年度は,更に基本周波数をも同時にモデル化するため,多空間分布HMMによって基本周波数をモデル化した。また,不特定話者モデルのクラスタリングの際に,MDL基準を用いた。2種類のモデル生成部を提案し,それぞれについて合成実験を行った。実際に1から3個の固有ベクトルの重みを変更して聴取実験を行った。スペクトル包絡の面では,男性的,女性的な合成音声を,基本周波数の面では,高い,低い合成音声などの声質を持つ音声を容易に合成することが出来た。
また,提案法の基になっているHMM音声合成システムの合成音声の品質向上のための検討をも行った。従来のシステムでは,励振源モデルとして有声区間と無声区間でパルス列と白色雑音源を切り換える単純なモデルを用いていたため,合成音声はボコーダ特有の品質であった。研究では,音声符号化手法であるMELPと同様の混合励振源モデルとポストフィルタを導入することにより合成音声の品質向上を検討した。合成音声の聴取実験によれば,品質が大幅に改善できることが確認できた。
以上の成果は,電子情報通信学会研究会,日本音響学会秋季発表会,Eurospeech2001において発表を行った。

  • 研究成果

    (5件)

すべて その他

すべて 文献書誌 (5件)

  • [文献書誌] 沢辺, 七里, 吉村, 徳田, 北村, 益子, 小林: "固有声手法に基づく音声合成におけるピッチのモデル化"日本音響学会2001年秋季研究発表会 講演論文集. I. 315-316 (2001)

  • [文献書誌] 吉村, 徳田, 益子, 小林, 北村: "HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入"電子情報通信学会音声研究会資料. SP2001-63. 17-22 (2001)

  • [文献書誌] 沢辺, 七里, 吉村, 徳田, 益子, 小林, 北村: "HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用"電子情報通信学会音声研究会資料. SP2001-72. 65-72 (2001)

  • [文献書誌] Yoshimura, Masuko, Tokuda, Kobayashi, Kitamura: "Mixed Excitation for HMM-based Speech Synthesis"Proceedings of EUROSPEECH2001. 779-782 (2001)

  • [文献書誌] 吉村, 徳田, 益子, 小林, 北村: "HMMに基づく音声合成における品質改善に関する検討"日本音響学会2001年秋季研究発表会 講演論文集. I. 371-372 (2001)

URL: 

公開日: 2003-04-03   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi