2005 Fiscal Year Annual Research Report

平均声に基づく多様な声質・発話スタイルが可能な音声合成の実現

Research Project

Project/Area Number	15300055
Research Institution	Tokyo Institute of Technology
Principal Investigator	小林隆夫東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)
Keywords	テキスト音声合成 / 平均声 / 感情音声・発話様式(スタイル) / 話者適応 / スタイル適応 / スタイル制御 / HMM音声合成 / 隠れセミマルコフモデル
Research Abstract	本研究では「平均声からの音声合成」という新たな音声合成の枠組みを発展させ,任意の話者の多様な声質や発話様式など,各個人が持っている話し方の個性を自由に表現でき,気の利いた音声インタラクションが実現可能な音声合成システムを開発することを目的とし,研究の最終年度として,平均声モデルから目標とする任意の話者モデルへの適応手法の確立,平静スタイルモデルから任意の感情表現・発話様式(スタイル)モデルへの適応手法の確立,指定した任意スタイルの音声を生成するスタイル制御手法の確立,そして各話者の個性を表現可能な音声合成システム実現の検討を行った。まず,平均声モデルから目標とする任意の話者モデルへの適応手法では,従来の最尤線形回帰(MLLR)に基づくモデル適応に加え,事後確率最大線形回帰(MAPLR),構造的MAPLR(SMAPLR),制約付MLLR(CMLLR)等のモデル適応手法に基づいて,隠れセミマルコフモデル(HSMM)を用いたモデル化のための適応アルゴリズムを導出し,合成音声の客観・主観評価を通して各手法の適応性能の比較検討を行った。そしてこの結果を基に,新たに制約付構造的MAPLR(CSMAPLR)適応アルゴリズムを提案し,その有効性を検討した。次に,任意のスタイルモデルへの適応手法では,音韻継続長を考慮したHSMMとスープラセグメンタル特徴に基づいたスタイル適応手法を導出し,スタイル適応合成音声の客観・主観評価を通して提案手法の有効性を示した。さらに,指定した任意のスタイルの音声を生成するためのスタイル制御手法として,重回帰HSMMに基づいた手法を提案し,その有効性を示した。そして,任意の声質・スタイルを直観的に制御可能な音声合成プロトタイプシステムを作成し,気の利いたインタラクションシステム実現の検討を行った。

Research Products
(20 results)

All 2006 2005

All Journal Article (20 results)

[Journal Article] 重回帰HSMMを用いた合成音声のスタイル制御2006
- Author(s)
  能勢隆
- Journal Title
  
  電子情報通信学会技術研究報告,SP2005-160 105・572
  
  Pages: 61-66
- Description
  「研究成果報告書概要(和文)」より
[Journal Article] 重回帰HSMMに基づく音声の発話様式・感情表現の推定2006
- Author(s)
  能勢隆
- Journal Title
  
  日本音響学会2006年春季研究発表会講演論文集
  
  Pages: 219-220
- Description
  「研究成果報告書概要(和文)」より
[Journal Article] 重回帰HSMMに基づく合成音声の声質制御の検討2006
- Author(s)
  橘誠
- Journal Title
  
  日本音響学会2006年春季研究発表会講演論文集
  
  Pages: 297-298
- Description
  「研究成果報告書概要(和文)」より
[Journal Article] A style adaptation technique for speech synthesis using HSMM and suprasegmental features2006
- Author(s)
  Makoto Tachibana
- Journal Title
  
  IEICE Trans.Information and Systems E89-D・3
  
  Pages: 1092-1099
[Journal Article] HSMM音声合成における話者適応とMAPに基づく音響モデル学習法2006
- Author(s)
  緒方克海
- Journal Title
  
  日本音響学会2006年春季研究発表会講演論文集
  
  Pages: 299-300
[Journal Article] HMM音声合成のための話者正規化クラスタリングと話者正規化学習2006
- Author(s)
  山岸順一
- Journal Title
  
  日本音響学会2006年春季研究発表会講演論文集
  
  Pages: 301-302
[Journal Article] 平均声に基づく音声合成のための話者適応アルゴリズムの評価2006
- Author(s)
  中野雄資
- Journal Title
  
  日本音響学会2006年春季研究発表会講演論文集
  
  Pages: 385-386
[Journal Article] 隠れセミマルコフモデルに基づく音声合成システムのためのスタイル適応手法の評価2005
- Author(s)
  橘誠
- Journal Title
  
  電子情報通信学会技術研究報告,SP2005-51 105・252
  
  Pages: 29-34
- Description
  「研究成果報告書概要(和文)」より
[Journal Article] 重回帰HSMMを用いた音声のスタイル制御法の検討2005
- Author(s)
  能勢隆
- Journal Title
  
  日本音響学会2005年秋季研究発表会講演論文集
  
  Pages: 287-288
- Description
  「研究成果報告書概要(和文)」より
[Journal Article] 多様な音声合成のためのスタイル適応アルゴリズムの比較検討2005
- Author(s)
  橘誠
- Journal Title
  
  日本音響学会2005年秋季研究発表会講演論文集
  
  Pages: 289-290
- Description
  「研究成果報告書概要(和文)」より
[Journal Article] Speech synthesis with various emotional expressions and speaking styles by style interpolation and morphing2005
- Author(s)
  Makoto Tachibana
- Journal Title
  
  IEICE Trans.Information and Systems E88-D・11
  
  Pages: 2484-2491
- Description
  「研究成果報告書概要(欧文)」より
[Journal Article] Adaptive training for hidden semi-Markov model2005
- Author(s)
  Junichi Yamagishi
- Journal Title
  
  Proc.2005 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2005 1
  
  Pages: 365-368
[Journal Article] Voiced/unvoiced determination of speech signal in noisy environment using harmonicity measure based on instantaneous frequency2005
- Author(s)
  Dhany Arifianto
- Journal Title
  
  Proc.2005 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2005 1
  
  Pages: 877-880
[Journal Article] Model adaptation and adaptive training using ESAT algorithm for HMM-based speech synthesis2005
- Author(s)
  Juri Isogai
- Journal Title
  
  Proc.9th European Conference on Speech Communication and Technology, INTERSPEECH 2005
  
  Pages: 2597-2600
[Journal Article] Performance evaluation of style adaptation for hidden semi-Markov model based speech synthesis2005
- Author(s)
  Makoto Tachibana
- Journal Title
  
  Proc.9th European Conference on Speech Communication and Technology, INTERSPEECH 2005
  
  Pages: 2805-2808
[Journal Article] 多様な音声合成のためめモデル適応・適応学習アルゴリズムの検討2005
- Author(s)
  磯貝朱里
- Journal Title
  
  電子情報通信学会技術研究報告,SP2005-50 105・252
  
  Pages: 23-28
[Journal Article] 多様な話者性および発話スタイル・感情表現による音声合成2005
- Author(s)
  小林隆夫
- Journal Title
  
  日本音響学会2005年秋季研究発表会講演論文集
  
  Pages: 283-286
[Journal Article] HMM音声合成におけるESATアルゴリズムの評価2005
- Author(s)
  磯貝朱里
- Journal Title
  
  日本音響学会2005年秋季研究発表会講演論文集
  
  Pages: 373-374
[Journal Article] 平均声に基づく音声合成のための話者適応アルゴリズムの検討2005
- Author(s)
  中野雄資
- Journal Title
  
  日本音響学会2005年秋季研究発表会講演論文集
  
  Pages: 395-396
[Journal Article] HSD-HMMを用いた音声のスタイル識別手法の評価2005
- Author(s)
  川島啓吾
- Journal Title
  
  日本音響学会2006年春季研究発表会講演論文集
  
  Pages: 165-166

2005 Fiscal Year Annual Research Report

平均声に基づく多様な声質・発話スタイルが可能な音声合成の実現

Principal Investigator

小林 隆夫 東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)

Research Products

[Journal Article] 重回帰HSMMを用いた合成音声のスタイル制御2006

Author(s)

Journal Title

Description

[Journal Article] 重回帰HSMMに基づく音声の発話様式・感情表現の推定2006

Author(s)

Journal Title

Description

[Journal Article] 重回帰HSMMに基づく合成音声の声質制御の検討2006

Author(s)

Journal Title

Description

[Journal Article] A style adaptation technique for speech synthesis using HSMM and suprasegmental features2006

Author(s)

Journal Title

[Journal Article] HSMM音声合成における話者適応とMAPに基づく音響モデル学習法2006

Author(s)

Journal Title

[Journal Article] HMM音声合成のための話者正規化クラスタリングと話者正規化学習2006

Author(s)

Journal Title

[Journal Article] 平均声に基づく音声合成のための話者適応アルゴリズムの評価2006

Author(s)

Journal Title

[Journal Article] 隠れセミマルコフモデルに基づく音声合成システムのためのスタイル適応手法の評価2005

Author(s)

Journal Title

Description

[Journal Article] 重回帰HSMMを用いた音声のスタイル制御法の検討2005

Author(s)

Journal Title

Description

[Journal Article] 多様な音声合成のためのスタイル適応アルゴリズムの比較検討2005

Author(s)

Journal Title

Description

[Journal Article] Speech synthesis with various emotional expressions and speaking styles by style interpolation and morphing2005

Author(s)

Journal Title

Description

[Journal Article] Adaptive training for hidden semi-Markov model2005

Author(s)

Journal Title

[Journal Article] Voiced/unvoiced determination of speech signal in noisy environment using harmonicity measure based on instantaneous frequency2005

Author(s)

Journal Title

[Journal Article] Model adaptation and adaptive training using ESAT algorithm for HMM-based speech synthesis2005

Author(s)

Journal Title

[Journal Article] Performance evaluation of style adaptation for hidden semi-Markov model based speech synthesis2005

Author(s)

Journal Title

[Journal Article] 多様な音声合成のためめモデル適応・適応学習アルゴリズムの検討2005

Author(s)

Journal Title

[Journal Article] 多様な話者性および発話スタイル・感情表現による音声合成2005

Author(s)

Journal Title

[Journal Article] HMM音声合成におけるESATアルゴリズムの評価2005

Author(s)

Journal Title

[Journal Article] 平均声に基づく音声合成のための話者適応アルゴリズムの検討2005

Author(s)

Journal Title

[Journal Article] HSD-HMMを用いた音声のスタイル識別手法の評価2005

Author(s)

Journal Title

小林隆夫東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)