• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

隠れマルコフモデルに基づくテキスト音声合成システムの実現

研究課題

研究課題/領域番号 10555125
研究種目

基盤研究(B)

配分区分補助金
応募区分展開研究
研究分野 情報通信工学
研究機関東京工業大学

研究代表者

小林 隆夫  東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)

研究分担者 益子 貴史  東京工業大学, 大学院・総合理工学研究科, 助手 (90272715)
徳田 恵一  名古屋工業大学, 工学部, 助教授 (20217483)
研究期間 (年度) 1998 – 2000
研究課題ステータス 完了 (2000年度)
配分額 *注記
4,500千円 (直接経費: 4,500千円)
2000年度: 1,100千円 (直接経費: 1,100千円)
1999年度: 3,400千円 (直接経費: 3,400千円)
キーワードテキスト音声合成 / 隠れマルコフモデル(HMM) / 多空間確率分布HMM(MSD-HMM) / HMM音声合成 / 声質変換 / 話者補間 / ピッチパターン / 音声パラメータ生成 / 形態素解析 / 話者適応 / 音声合成 / 隠れマルコフモデル / テキスト解析 / MSLRパーザ / 音声合成システム / ピッチ / 音質変換
研究概要

従来の音声合成手法では実現することの難しかった多様な音声の合成を可能とする音声合成システムを,隠れマルコフモデル(HMM)に基づいて実現することを目的として研究を行い,以下の成果が得られた。
1.HMMによる音韻情報と韻律情報のモデル化:多空間上の確率分布に基づいたHMM(MSD-HMM)の概念を導入することにより,特別な仮定なしにピッチパターンをHMMにより直接モデル化する手法を開発し,スペクトル,ピッチ,継続長をHMMの枠組みで統一的に同時モデル化する手法を確立した。
2.HMMからのパラメータ生成:動的特徴量を考慮したHMMからのスペクトルパラメータ系列生成法を一般化し,状態系列あるいはその一部を非可観測としたまま尤度を最大にするアルゴリズムを開発し,HMMからのパラメータ生成法を確立した。また,韻律情報についても,MSD-HMMに基づいてピッチパターンを生成する手法を開発した。
3.HMMに基づくテキスト音声合成システムの実現:テキスト解析部として,品詞に基づいたNクラスモデルを利用した統計的形態素解析器とEDR辞書及び規則に基づくアクセント付与システムを構築し,上記HMMによる音韻・韻律情報のモデル化及びHMMからのパラメータ生成法に基づいて音声合成部を構成することにより,ワークステーションやパソコンで動作するテキスト音声合成システムを実現した。
4.多様な声質による音声合成:実現したHMM音声合成システムにおいて,音声合成単位HMMを話者適応することにより,合成音声の声質を他の話者の声質に変換する手法を開発した。さらに,任意の異なる話者間の声質を補間する手法も開発し,これらの手法により多様な声質による音声合成が実現可能なことを示した。

報告書

(4件)
  • 2000 実績報告書   研究成果報告書概要
  • 1999 実績報告書
  • 1998 実績報告書
  • 研究成果

    (52件)

すべて その他

すべて 文献書誌 (52件)

  • [文献書誌] 広井順,徳田恵一,益子貴史,小林隆夫,北村正: "HMMに基づいた極低ビットレート音声符号化"電子情報通信学会論文誌. J82-D-II・11. 1857-1864 (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] T.Yoshimura,K.Tokuda,T.Masuko,T.Kobayashi,T.Kitamura: "Speaker interpolation for HMM-based speech synthesis system"J.of Acoustical Society of Japan (E). 21-4. 199-206 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] 徳田恵一,益子貴史,宮崎昇,小林隆夫: "多空間上の確率分布に基づいたHMM"電子情報通信学会論文誌. J83-D-II・7. 1579-1589 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] 益子貴史,徳田恵一,宮崎昇,小林隆夫: "多空間確率分布HMMによるピッチパターン生成"電子情報通信学会論文誌. J83-D-II・7. 1600-1609 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] 吉村貴克,徳田恵一,益子貴史,小林隆夫,北村正: "HMMに基づく音声合成におけるスペクトル・ピッチ・継続長の同時モデル化"電子情報通信学会論文誌. J83-D-II・11. 2099-2107 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] 益子貴史,徳田恵一,小林隆夫: "話者照合システムに対する合成音声による詐称"電子情報通信学会論文誌. J83-D-II・11. 2283-2290 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] 益子貴史,田村正統,徳田恵一,小林隆夫: "HMMに基づく音声合成システムにおけるMAP-VFSを用いた声質変換"電子情報通信学会論文誌. J83-D-II・12. 2509-2516 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] K.Tokuda,T.Masuko,J.Hiroi,T.Kobayashi,T.Kitamura: "A very low bit rate speech coder using HMM-based Speech recognition/synthesis"Proc.of 1998 IEEE, International Conference on Acoustics, Speech, and Signal Processing. 2. 609-612 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] T.Masuko,T.Kobayashi,M.Tamura,J.Masubuchi,K.Tokuda: "Text-to-visual speech synthesis based on parameter generation from HMM"Proc.of 1998 IEEE, International Conference on Acoustics, Speech, and Signal Processing. 6. 3745-3748 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] M.Tamura,T.Masuko,K.Tokuda,T.Kobayashi: "Speaker adaptation for HMM-based speech synthesis system using MLLR"Proc.of ESCA/COCOSDA, International Workshop on Speech Synthesis. 273-276 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] T.Yoshimura,T.Masuko,K.Tokuda,T.Kobayashi,T.Kitamura: "Duration modeling for HMM-based speech synthesis"Proc.of 5th International Conference on Spoken Language Processing. 2. 29-32 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] T.Masuko,K.Tokuda,T.Kobayashi: "A very low bit rate Speech coder using HMM with speaker adaptation"Proc.of 5th International Conference on Spoken Language Processing. 2. 507-510 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] M.Tamura,T.Masuko,T.Kobayashi,K.Tokuda: "Visual speech synthesis based on parameter generation from HMM : Speech-Driven and text-and-speech-driven approaches"Proc.of International Conference on Auditory-Visual Speech Processing. 219-224 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] K.Tokuda,T.Masuko,N.Miyazaki,T.Kobayashi: "Hidden Markov models based on multi-space probability distribution for pitch pattern modeling"Proc.1999 IEEE International Conference on Acoustics, Speech, and Signal Processing. 1. 229-232 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] T.Yoshimura,K.Tokuda,T.Masuko,T.Kobayashi,T.Kitamura: "Simultaneous modeling of spectrum, pitch and duration in HMM-based speech synthesis"Proc.of 6th European Conf.on Speech Communication and Technology. 6. 2347-2350 (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] M.Tamura,S.Kondo,T.Masuko T.Kobayashi: "Text-to-audio visual speech synthesis based on parameter generation from HMM"Proc.of 6th European Conference on Speech Communication and Technology. 1. 959-962 (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] T.Masuko,T.Hitotsumatsu,K.Tokuda,T.Kobayashi: "On the security of HMM-based speaker verification systems against imposture using synthetic speech"Proc.of 6th European Conf.on Speech Communication and Technology. 3. 1223-1226 (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] K.Tokuda,T.Yoshimura,T.Masuko,T.Kobayashi,T.Kitamura: "Speech parameter generation algorithms for HMM-based speech synthesis "Proc.of 2000 IEEE International Conference on Acoustics, Speech, and Signal Processing. 3. 1315-1318 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] T.Masuko,K.Tokuda,T.Kobayashi: "Imposture using Synthetic speech against text-prompted speaker verification based on spectrum and pitch"Proc.of 6th International Conference on Spoken Language Processing. 2. 302-305 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] S.Sako,K.Tokuda,T.Masuko,T.Kobayashi,T.Kitamura: "HMM-based text-to-audio-visual speech synthesis"Proc.of 6th International Conference on Spoken Language Processing. 3. 25-28 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Jun Hiroi, Keiichi Tokuda, Takashi Masuko, Takao Kobayashi, Tadashi Kitamura: "Very low bit rate speech coding based on HMMs"IEICE Trans.. D-II,11. 1857-1864 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Takayoshi Yoshimura, Keiichi Tokuda, Takashi Masuko, Takao Kobayashi, Tadashi Kitamura: "Speaker interpolation for HMM-based speech synthesis system"J.Acoust. Soc. Jpn. (E). 21,4. 199-206 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Takashi Masuko, Keiichi Tokuda, Noboru Miyazaki, Takao Kobayashi: "Multi-space probability distribution HMM"IEICE Trans.. D-II,7. 1579-1589 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Keiichi Tokuda, Takashi Masuko, Noboru Miyazaki, Takao Kobayashi: "Pitch pattern generation using multi-space probability distribution HMM"IEICE Trans.. D-II,7. 1600-1609 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Takayoshi Yoshimura, Keiichi Tokuda, Takashi Masuko, Takao Kobayashi, Tadashi Kitamura: "Simultaneous modeling of spectrum, pitch and duration in HMM-based speech synthesis"IEICE Trans.. D-II, 11. 2099-2107 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Takashi Masuko, Keiichi Tokuda, Takao Kobayashi: "Imposture against a speaker verification system using synthetic speech"IEICE Trans.. D-II, 11. 2283-2290 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Takashi Masuko, Masatsune Tamura, Keiichi Tokuda, Takao Kobayashi: "Voice characteristics conversion for HMM-based speech synthesis system Using MAP-VFS"IEICE Trans.. D-II, 12. 2509-2516 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Keiichi Tokuda, Takasi Masuko, Jun Hiroi, Takao Kobayashi, Tadasi Kitamura: "A very low bit rate speech coder using HMM-based speech recognition/synthesis"Proc. of 1998 IEEE, International Conference on Acoustics, Speech, and Signal Processing. 2. 609-612 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Takasi Masuko, Takao Kobayashi, Masatsune Tamura, Jun Masubuchi, Keiichi Tokuda: "Text-to-visual speech synthesis based on parameter generation from HMM"Proc. of 1998 IEEE, International Conference on Acoustics, Speech, and Signal Processing. 6. 3745-3748 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Masatsune Tamura, Takashi Masuko, Keiichi Tokuda, Takao Kobayashi: "Speaker adaptation for HMM-based speech synthesis system using MLLR"Proc. of ESCA/COCOSDA International Workshop on Speech Synthesis. 273-276 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Takayoshi Yoshimura, Takashi Masuko, Keiichi Tokuda, Takao Kobayashi, Tadashi Kitamura: "Duration modeling for HMM-based speech synthesis"Proc. of 5th International Conference on Spoken Language Processing. 2. 29-32 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Takashi Masuko, Keiichi Tokuda, Takao Kobayashi: "A very low bit rate Speech coder using HMM with speaker adaptation"Proc. of 5th International Conference on Spoken Language Processing. 2. 507-510 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Masatsune Tamura, Takashi Masuko, Takao Kobayashi, Keiichi Tokuda: "Visual speech synthesis based on parameter generation from HMM : Speech-Driven and text-and-speech-driven approaches"Proc. of International Conference on Auditory-Visual Speech Processing. 219-224 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Keiichi Tokuda, Takashi Masuko, Noboru Miyazaki, Takao Kobayashi: "Hidden Markov models based on multi-space probability distribution for pitch pattern modeling"Proc. 1999 IEEE International Conf. on Acoustics, Speech, and Signal Processing. 1. 229-232 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Masatsune Tamura, Shigekazu Kondo, Takashi Masuko, Takao Kobayashi: "Text-to-audio-visual speech synthesis based on parameter generation from HMM"Proc. of 6th European Conf. on Speech Communication and Technology. 2. 959-962 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Takashi Masuko, Takafumi Hitotsumatsu, Keiichi Tokuda, Takao Kobayashi: "On the security of HMM-based speaker verification systems against imposture using synthetic speech"Proc. of 6th European Conf. on Speech Communication and Technology. 3. 1223-1226 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Takayoshi Yoshimura, Keiichi Tokuda, Takashi Masuko, Takao Kobayashi, Tadashi Kitamura: "Simultaneous modeling of spectrum, pitch and duration in HMM-based speech synthesis"Proc. of 6th European Conf. on Speech Communication and Technology. 6. 2347-2350 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Keiichi Tokuda, Takayoshi Yoshimura, Takashi Masuko, Takao Kobayashi, Tadashi Kitamura: "Speech parameter generation algorithms for HMM-based speech synthesis"Proc. of 2000 IEEE International Conference on Acoustics, Speech, and Signal Processing. 3. 1315-1318 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Takashi Masuko, Keiichi Tokuda, Takao Kobayashi: "Imposture using Synthetic speech against text-prompted speaker verification based on spectrum and pitch"Proc. of 6th International Conference on Spoken Language Processing. 2. 302-305 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Shuji Sako, Keiichi Tokuda, Takashi Masuko, Takao Kobayashi, Tadashi Kitamura: "HMM-based text-to-audio-visual speech synthesis"Proc. of 6th International Conference on Spoken Language Processing. 3. 25-28 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] 益子貴史,田村正統,徳田恵一,小林隆夫: "HMMに基づく音声合成システムにおけるMAP-VFSを用いた声質変換"電子情報通信学会論文誌. J83-D-II・12. 2509-2516 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 吉村貴克,徳田恵一,益子貴史,小林隆夫,北村正: "HMMに基づく音声合成におけるスペクトル・ピッチ・継続長の同時モデル化"電子情報通信学会論文誌. J83-D-II・11. 2099-2107 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 徳田恵一,益子貴史,宮崎昇,小林隆夫: "多空間上の確率分布に基づいたHMM"電子情報通信学会論文誌. J83-D-II・7. 1579-1589 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 益子貴史,徳田恵一,宮崎昇,小林隆夫: "多空間確率分布HMMによるピッチパターン生成"電子情報通信学会論文誌. J83-D-II・7. 1600-1609 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] T.Yoshimura,K.Tokuda,T.Masuko,T.Kobayashi,T.Kitamura: "Speaker interpolation for HMM-based speech synthesis system"J.Acoust.Soc.Jpn.(E). 21・4. 199-206 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] K.Tokuda,T.Masuko,T.Kobayashi,T.Kitamura: "Parameter generation algorithms for HMM-based speech synthesis"Proc.IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2000. III. 1315-1318 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] T.Yoshimura,K.Tokuda,T.Masuko,T.Kobayashi,T.Kitamura: "Simultaneous modeling of spectrum,pitch and duration in HMM-based speech synthesis"Proc.6th European Conference on Speech Communication and Technology,EUROSPEECH'99. EUROSPEECH-99・5. 2347-2350 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] 吉村 貴克,徳田 恵一,益子 貴史,小林 隆夫,北村 正: "HMMに基づく音声合成におけるスペクトル・ピッチ・状態継続長の同時モデル化"電子情報通信学会技術研究報告(SP). 99・255. 33-38 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] 吉村 貴克,徳田 恵一,益子 貴史,小林 隆夫,北村 正: "HMMに基づく音声合成のためのスペクトラム,ピッチ,状態継続長のモデル化"日本音響学会平成11年度春季研究発表会講演論文集. 241-242 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] 田村 正統,益子 貴史,徳田 恵一,小林 隆夫: "MLLRおよびMAP/VFSを用いたHMM音声合成における話者適応"日本音響学会平成11年度春季研究発表会講演論文集. 243-244 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] 一ツ松 孝文,益子 貴史,小林 隆夫,徳田 恵一: "合成音声を用いたテキスト指定型話者照合システムにおける詐称の検討"日本音響学会平成11年度春季研究発表会講演論文集. 265-266 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] 吉村 貴克,徳田 恵一,益子 貴史,小林 隆夫,北村 正: "HMMに基づくピッチパターン生成における動的特徴量の効果"日本音響学会平成11年度秋季研究発表会講演論文集. 215-216 (1999)

    • 関連する報告書
      1999 実績報告書

URL: 

公開日: 1999-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi