2004 Fiscal Year Annual Research Report

平均声に基づく多様な声質・発話スタイルが可能な音声合成の実現

Research Project

Project/Area Number	15300055
Research Institution	Tokyo Institute of Technology
Principal Investigator	小林隆夫東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)
Co-Investigator(Kenkyū-buntansha)	益子貴史株式会社東芝, 研究開発センターマルチメディアラボラトリー, 研究主務(研究職) (90272715) 住田一男株式会社東芝, 研究開発センター知識メディアラボラトリー, 室長(研究職)
Keywords	テキスト音声合成 / 平均声 / 感情音声・発話スタイル / スタイル適応 / スタイル補間 / スタイル制御 / HMM音声合成 / 隠れセミマルコフモデル(HSMM)
Research Abstract	本研究では「平均声からの音声合成」という新たな音声合成の枠組みを発展させ,任意の話者の多様な声質や発話様式など,各個人が持っている話し方の個性を自由に表現でき,気の利いた音声インタラクションが実現可能な音声合成システムを開発することを目的とし,研究の第2年度として,平均声のモデル化・適応手法の精密化,および多様な発話スタイル・感情を含む音声のモデル化と適応手法の検討を行うとともに,初年度に引続き研究基盤の整備を行った。まず,平均声のモデル化手法とモデル適応手法の精密化では,これまで近似的に実装されてきた音韻継続長のモデル化と適応手法について,隠れマルコフモデルに状態継続長分布を明示的に導入した隠れセミマルコフモデルを用いる定式化とこれに基づくモデル適応アルゴリズムを提案した。主観評価実験を通して,従来法に比べてより精密なモデル化と自然性の高い音声の合成が可能であることを示した。適応手法についても拡張話者適応学習に基づく新たな手法の検討を行った。一方,発話スタイル・感情を含む音声に対しては,各スタイルの強調度合を直接的に指定可能なスタイル制御手法を提案し,評価実験を通して有効性を示した。また,スタイル補間手法についても,より詳細な評価実験を行った。さらに,「安心/不安」,「親しげ/嫌悪」,「速く/ゆっくり」というスタイルについても,モデル化を検討した。この他にも,モデル構築における決定木の停止基準に関する検討,研究実施の基盤となる音声データベースの整備を行った。

Research Products
(17 results)

All 2005 2004

All Journal Article (17 results)

[Journal Article] Acoustic modeling of speaking styles and emotional expressions in HMM-based speech synthesis2005
- Author(s)
  Junichi Yamagishi
- Journal Title
  
  IEICE Trans. Information and Systems E88-D・3
  
  Pages: 502-509
- Description
  「研究成果報告書概要(和文)」より
[Journal Article] 隠れセミマルコフモデルに基づく適応学習アルゴリズム2005
- Author(s)
  山岸順一
- Journal Title
  
  日本音響学会2005年春季研究発表会講演論文集 I・1-1-17
  
  Pages: 187-188
[Journal Article] HMM音声合成におけるESATアルゴリズムを用いたモデル適応および適応学習の検討2005
- Author(s)
  磯貝朱里
- Journal Title
  
  日本音響学会2005年春季研究発表会講演論文集 I・1-1-18
  
  Pages: 189-190
[Journal Article] モデル補間による発話スタイル・感情表現の制御の検討2005
- Author(s)
  橘誠
- Journal Title
  
  日本音響学会2005年春季研究発表会講演論文集 I・1-1-19
  
  Pages: 191-192
[Journal Article] HMM音声合成における決定木の分割停止基準の検討2005
- Author(s)
  野村大輔
- Journal Title
  
  日本音響学会2005年春季研究発表会講演論文集 I・3-P-26
  
  Pages: 291-292
[Journal Article] Robust F0 estimation of speech signal using harmonicity measure based on instantaneous frequency2004
- Author(s)
  Dhany Arifianto
- Journal Title
  
  IEICE Trans. Information and Systems E87-D・12
  
  Pages: 2812-2820
- Description
  「研究成果報告書概要(和文)」より
[Journal Article] Speaking style adaptation using context clustering decision tree for HMM-based speech synthesis2004
- Author(s)
  Junichi Yamagishi
- Journal Title
  
  Proc. the 2004 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2004 I
  
  Pages: 5-8
- Description
  「研究成果報告書概要(和文)」より
[Journal Article] コーパスベース音声合成技術の動向[IV]-HMM音声合成方式-2004
- Author(s)
  小林隆夫
- Journal Title
  
  電子情報通信学会誌 87・4
  
  Pages: 322-327
[Journal Article] MLLR adaptation for hidden semi-Markov model based speech synthesis2004
- Author(s)
  Junichi Yamagishi
- Journal Title
  
  Proc. the 8th International Conference on Spoken Language Processing, INTERSPEECH 2004-ICSLP CD-ROM・WeC1401o.5
[Journal Article] Hidden semi-Markov model based speech synthesis2004
- Author(s)
  Heiga Zen
- Journal Title
  
  Proc. the 8th International Conference on Spoken Language Processing, INTERSPEECH 2004-ICSLP CD-ROM・WeC1401o.5
[Journal Article] A style control technique for HMM-based speech synthesis2004
- Author(s)
  Keisuke Miyanaga
- Journal Title
  
  Proc. the 8th International Conference on Spoken Language Processing, INTERSPEECH 2004-ICSLP CD-ROM・Spec4701o.4
[Journal Article] HMM-based speech synthesis with various speaking styles using model interpolation2004
- Author(s)
  Makoto Tachibana
- Journal Title
  
  Proc. the 2nd International Conference on Speech Prosody, SP2004
  
  Pages: 413-416
[Journal Article] 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰によるスタイル適応の検討2004
- Author(s)
  山岸順一
- Journal Title
  
  電子情報通信学会技術研究報告 104・252
  
  Pages: 13-18
[Journal Article] HMM音声合成における多様なスタイル実現のための制御法2004
- Author(s)
  宮永圭介
- Journal Title
  
  電子情報通信学会技術研究報告 104・30
  
  Pages: 35-40
[Journal Article] 多空間確率分布に基づくポーズのモデル化2004
- Author(s)
  尾関創
- Journal Title
  
  電子情報通信学会技術研究報告 104・30
  
  Pages: 5-8
[Journal Article] 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰の検討2004
- Author(s)
  山岸順一
- Journal Title
  
  日本音響学会2004年秋季研究発表会講演論文集 I・3-2-8
  
  Pages: 331-332
[Journal Article] 隠れセミマルコフモデルに基づく音声合成におけるスタイル適応の評価2004
- Author(s)
  橘誠
- Journal Title
  
  日本音響学会2004年秋季研究発表会講演論文集 I・3-2-9
  
  Pages: 333-334

2004 Fiscal Year Annual Research Report

平均声に基づく多様な声質・発話スタイルが可能な音声合成の実現

Principal Investigator

小林 隆夫 東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)

Research Products

[Journal Article] Acoustic modeling of speaking styles and emotional expressions in HMM-based speech synthesis2005

Author(s)

Journal Title

Description

[Journal Article] 隠れセミマルコフモデルに基づく適応学習アルゴリズム2005

Author(s)

Journal Title

[Journal Article] HMM音声合成におけるESATアルゴリズムを用いたモデル適応および適応学習の検討2005

Author(s)

Journal Title

[Journal Article] モデル補間による発話スタイル・感情表現の制御の検討2005

Author(s)

Journal Title

[Journal Article] HMM音声合成における決定木の分割停止基準の検討2005

Author(s)

Journal Title

[Journal Article] Robust F0 estimation of speech signal using harmonicity measure based on instantaneous frequency2004

Author(s)

Journal Title

Description

[Journal Article] Speaking style adaptation using context clustering decision tree for HMM-based speech synthesis2004

Author(s)

Journal Title

Description

[Journal Article] コーパスベース音声合成技術の動向[IV]-HMM音声合成方式-2004

Author(s)

Journal Title

[Journal Article] MLLR adaptation for hidden semi-Markov model based speech synthesis2004

Author(s)

Journal Title

[Journal Article] Hidden semi-Markov model based speech synthesis2004

Author(s)

Journal Title

[Journal Article] A style control technique for HMM-based speech synthesis2004

Author(s)

Journal Title

[Journal Article] HMM-based speech synthesis with various speaking styles using model interpolation2004

Author(s)

Journal Title

[Journal Article] 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰によるスタイル適応の検討2004

Author(s)

Journal Title

[Journal Article] HMM音声合成における多様なスタイル実現のための制御法2004

Author(s)

Journal Title

[Journal Article] 多空間確率分布に基づくポーズのモデル化2004

Author(s)

Journal Title

[Journal Article] 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰の検討2004

Author(s)

Journal Title

[Journal Article] 隠れセミマルコフモデルに基づく音声合成におけるスタイル適応の評価2004

Author(s)

Journal Title

小林隆夫東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)