任意の話者性・感情表現・発話様式によるテキスト音声合成の実現

Research Project

Project/Area Number	04J04633
Research Category	Grant-in-Aid for JSPS Fellows
Allocation Type	Single-year Grants
Section	国内
Research Field	Perception information processing/Intelligent robotics
Research Institution	Tokyo Institute of Technology
Principal Investigator	山岸順一東京工業大学, 大学院・総合理工学研究科, 特別研究員(DC1)
Project Period (FY)	2004 – 2006
Project Status	Completed (Fiscal Year 2005)
Budget Amount *help	¥1,900,000 (Direct Cost: ¥1,900,000) Fiscal Year 2005: ¥900,000 (Direct Cost: ¥900,000) Fiscal Year 2004: ¥1,000,000 (Direct Cost: ¥1,000,000)
Keywords	音声合成 / 音声信号処理 / 統計的音声情報処理 / 統計的音声合成 / 隠れマルコフモデル / ヒューマンインターフェース / 多様な音声合成 / 感情・発話様式を伴う音声合成 / 感情表現を伴う音声合成 / 多様な発話様式による音声合成 / 統計的音声処理
Research Abstract	本研究では,任意の話者性・感情表現・発話様式によるテキスト音声合成システムの実現を目標に,平均声と話者適応/スタイル適応技術を組み合わせた新たな音声合成方式の検討を行っている.昨年度は隠れセミマルコフモデルという通常の隠れマルコフモデルを拡張した統計モデルの枠組みを利用することで,スペクトルと基本周波数と音韻継続長という音声の3つの特徴量を同時に変換することが可能な話者適応アルゴリズムを開発し,その有効性を示した.しかし,上記の実験に用いた話者適応アルゴリズムは,最尤線形回帰という隠れマルコフモデルの出力分布の平均ベクトルをアフィン変換するだけの非常に単純な手法であり,より緻密で適切なモデル変換を頑健に行うためには話者適応アルゴリズムの改善が必要である. そこで本年度は,話者適応アルゴリズムの変換精度を向上させることを目的に,様々な話者適応アルゴリズムを隠れセミマルコフモデルの枠組みにおいて再定式化し,音声合成システムへ導入することで昨年度提案した手法との比較検討を行った.新たに検討したモデル適応アルゴリズムとしては,隠れセミマルコフモデルの出力分布の平均ベクトルだけでなく共分散行列も変換を行う制約付き最尤線形回帰や,変換パラメータの推定に最尤推定ではなく事後確率最大化推定を導入することでより少量のデータでも頑健に変換パラメータを推定できるように拡張した事後確率最大化線形回帰などを導入し,比較検討を行った。またこれらの制約付き線形回帰と事後確率最大化線形回帰を組み合わせた新たな話者適応アルゴリズムの開発も行い,話者適応のより一段の精度向上が図れたことを実験結果から確認した.さらにこれらの線形回帰によるモデル変換後に,データサンプルのある分布に対し事後確率最大化推定を行う手法も導入し,話者適応により変換された分布が利用可能なデータ量の増加に従い最尤推定の結果に漸近的に近づいていくことも確認した.この手法により、統一の枠組みで様々なデータ量に適したモデルを作成できる. また,これらの話者適応アルゴリズムを話者の変換ではなく,音声のスタイルの変換に利用するスタイル適応にも応用し,その有効性を検討した.スタイルを伴った音声の適応では基本周波数や音韻継続長が重要な役割を担っていることからこれらのモデル適応アルゴリズムの大きな効果が確認された.

Report

(2 results)

2005 Annual Research Report
2004 Annual Research Report

Research Products
(23 results)

All 2006 2005 2004

All Journal Article (23 results)

[Journal Article] HSMM-based model adaptation algorithms for average-voice-based speech synthesis2006
- Author(s)
  J.Yamagishi, K.Ogata, Y.Nakano, J.Isogai, T.Kobayashi
- Journal Title
  
  Proc. 2006 IEEE International Conference on Acoustics, Speech and Signal Processing (掲載決定)
- Related Report
  2005 Annual Research Report
[Journal Article] A style adaptation technique for speech synthesis using HSMM and suprasegmental features2006
- Author(s)
  M.Tachibana, J.Yamagishi, T.Masuko, T.Kobayashi
- Journal Title
  
  IEICE Trans. Information and Systems E89-D
  
  Pages: 1092-1099
- Related Report
  2005 Annual Research Report
[Journal Article] HSMM音声合成における話者適応とMAPに基づく音響モデル学習法2006
- Author(s)
  緒方克海, 中野雄資, 山岸順一, 小林隆夫
- Journal Title
  
  日本音響学会2006年春季研究発表会講演論文集 2-4-19
  
  Pages: 299-300
- Related Report
  2005 Annual Research Report
[Journal Article] HMM音声合成のための話者正規化クラスタリングと話者正規化学習2006
- Author(s)
  山岸順一, 小林隆夫
- Journal Title
  
  日本音響学会2006年春季研究発表会講演論文集 2-4-20
  
  Pages: 301-302
- Related Report
  2005 Annual Research Report
[Journal Article] 平均声に基づく音声合成のための話者適応アルゴリズムの評価2006
- Author(s)
  中野雄資, 緒方克海, 山岸順一, 小林隆夫
- Journal Title
  
  日本音響学会2006年春季研究発表会講演論文集 1-Q-26
  
  Pages: 385-386
- Related Report
  2005 Annual Research Report
[Journal Article] Model adaptation and adaptive training using ESAT algorithms for HMM-based speech synthesis2005
- Author(s)
  J.Isogai, J.Yamagishi, T.Kobayashi
- Journal Title
  
  Proc. 9th European Conference on Speech Communication and Technology
  
  Pages: 2597-2600
- Related Report
  2005 Annual Research Report
[Journal Article] Performance evaluation of style adaptation for hidden semi-Markov model based speech synthesis2005
- Author(s)
  M.Tachibana, J.Yamagishi, T.Masuko, T.Kobayashi
- Journal Title
  
  Proc. 9th European Conference on Speech Communication and Technology
  
  Pages: 2597-2600
- Related Report
  2005 Annual Research Report
[Journal Article] 多様な音声合成のためのモデル適応・適応学習アルゴリズムの検討2005
- Author(s)
  磯貝朱里, 緒方克海, 中野雄資, 山岸順一, 小林隆夫
- Journal Title
  
  電子情報通信学会技術研究報告 Vol.105 No.252
  
  Pages: 23-28
- NAID
  110003298750
- Related Report
  2005 Annual Research Report
[Journal Article] 隠れセミマルコフモデルに基づく音声合成システムのためのスタイル適応手法の評価2005
- Author(s)
  橘誠, 山岸順一, 小林隆夫
- Journal Title
  
  電子情報通信学会技術研究報告 Vol.105 No.252
  
  Pages: 29-34
- NAID
  110003298752
- Related Report
  2005 Annual Research Report
[Journal Article] 平均声に基づく音声合成のための話者適応アルゴリズムの検討2005
- Author(s)
  中野雄資, 緒方克海, 磯貝朱里, 山岸順一, 小林隆夫
- Journal Title
  
  日本音響学会2005年秋季研究発表会講演論文集 1-Q-11
  
  Pages: 395-396
- Related Report
  2005 Annual Research Report
[Journal Article] 多様な音声合成のためのスタイル適応アルゴリズムの比較検討2005
- Author(s)
  橘誠, 山岸順一, 小林隆夫
- Journal Title
  
  日本音響学会2005年秋季研究発表会講演論文集 2-6-14
  
  Pages: 289-290
- Related Report
  2005 Annual Research Report
[Journal Article] HMM音声合成におけるESATアルゴリズムの評価2005
- Author(s)
  磯貝朱里, 山岸順一, 小林隆夫
- Journal Title
  
  日本音響学会2005年秋季研究発表会講演論文集 3-6-23
  
  Pages: 373-374
- Related Report
  2005 Annual Research Report
[Journal Article] Acoustic Modeling of Speaking Styles and Emotional Expressions in HMM-based Speech Synthesis2005
- Author(s)
  山岸順一
- Journal Title
  
  IEICE Trans. Information and Systems Vol.E88-D, No.3
  
  Pages: 502-509
- NAID
  110003214212
- Related Report
  2004 Annual Research Report
[Journal Article] Adaptive training for hidden semi-Markov model2005
- Author(s)
  山岸順一
- Journal Title
  
  Proc. the 2005 IEEE International Conference on Acoustics, Speech and Signal Processing (発表予定)
- Related Report
  2004 Annual Research Report
[Journal Article] 隠れセミマルコフモデルに基づく適応学習アルゴリズム2005
- Author(s)
  山岸順一
- Journal Title
  
  日本音響学会2005年春季研究発表会講演論文集 (発表予定)
- NAID
  10018037428
- Related Report
  2004 Annual Research Report
[Journal Article] モデル補間による発話スタイル・感情表現の制御の検討2005
- Author(s)
  橘誠
- Journal Title
  
  日本音響学会2005年春季研究発表会講演論文集 (発表予定)
- Related Report
  2004 Annual Research Report
[Journal Article] HMM音声合成におけるESATアルゴリズムを用いたモデル適応および適応学習の検討2005
- Author(s)
  磯貝朱里
- Journal Title
  
  日本音響学会2005年春季研究発表会講演論文集 (発表予定)
- Related Report
  2004 Annual Research Report
[Journal Article] HMM音声合成における決定木の分割停止基準の検討2005
- Author(s)
  野村大輔
- Journal Title
  
  日本音響学会2005年春季研究発表会講演論文集 (発表予定)
- Related Report
  2004 Annual Research Report
[Journal Article] MLLR adaptation for hidden semi-Markov model based speech synthesis2004
- Author(s)
  山岸順一
- Journal Title
  
  Proc. the 8th International Conference on Spoken Language 2004
- Related Report
  2004 Annual Research Report
[Journal Article] Speaking style adaptation using context clustering decision tree for HMM-based speech synthesis2004
- Author(s)
  山岸順一
- Journal Title
  
  Proc. the 2004 IEEE International Conference on Acoustics, Speech and Signal Processing Vol.I
  
  Pages: 5-8
- Related Report
  2004 Annual Research Report
[Journal Article] 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰よるスタイル適応の検討2004
- Author(s)
  山岸順二
- Journal Title
  
  電子情報通信学会技術研究報告 vol.104
  
  Pages: 13-18
- Related Report
  2004 Annual Research Report
[Journal Article] 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰の検討2004
- Author(s)
  山岸順一
- Journal Title
  
  日本音響学会2004年秋季研究発表会講演論文集 I
  
  Pages: 331-332
- Related Report
  2004 Annual Research Report
[Journal Article] 隠れセミマルコフモデルに基づく音声合成におけるスタイル適応の評価2004
- Author(s)
  橘誠
- Journal Title
  
  日本音響学会2004年秋季研究発表会講演論文集 I
  
  Pages: 333-334
- Related Report
  2004 Annual Research Report

任意の話者性・感情表現・発話様式によるテキスト音声合成の実現

Principal Investigator

山岸 順一 東京工業大学, 大学院・総合理工学研究科, 特別研究員(DC1)

¥1,900,000 (Direct Cost: ¥1,900,000)

Report

Research Products

[Journal Article] HSMM-based model adaptation algorithms for average-voice-based speech synthesis2006

Author(s)

Journal Title

Related Report

[Journal Article] A style adaptation technique for speech synthesis using HSMM and suprasegmental features2006

Author(s)

Journal Title

Related Report

[Journal Article] HSMM音声合成における話者適応とMAPに基づく音響モデル学習法2006

Author(s)

Journal Title

Related Report

[Journal Article] HMM音声合成のための話者正規化クラスタリングと話者正規化学習2006

Author(s)

Journal Title

Related Report

[Journal Article] 平均声に基づく音声合成のための話者適応アルゴリズムの評価2006

Author(s)

Journal Title

Related Report

[Journal Article] Model adaptation and adaptive training using ESAT algorithms for HMM-based speech synthesis2005

Author(s)

Journal Title

Related Report

[Journal Article] Performance evaluation of style adaptation for hidden semi-Markov model based speech synthesis2005

Author(s)

Journal Title

Related Report

[Journal Article] 多様な音声合成のためのモデル適応・適応学習アルゴリズムの検討2005

Author(s)

Journal Title

NAID

Related Report

[Journal Article] 隠れセミマルコフモデルに基づく音声合成システムのためのスタイル適応手法の評価2005

Author(s)

Journal Title

NAID

Related Report

[Journal Article] 平均声に基づく音声合成のための話者適応アルゴリズムの検討2005

Author(s)

Journal Title

Related Report

[Journal Article] 多様な音声合成のためのスタイル適応アルゴリズムの比較検討2005

Author(s)

Journal Title

Related Report

[Journal Article] HMM音声合成におけるESATアルゴリズムの評価2005

Author(s)

Journal Title

Related Report

[Journal Article] Acoustic Modeling of Speaking Styles and Emotional Expressions in HMM-based Speech Synthesis2005

Author(s)

Journal Title

NAID

Related Report

[Journal Article] Adaptive training for hidden semi-Markov model2005

Author(s)

Journal Title

Related Report

[Journal Article] 隠れセミマルコフモデルに基づく適応学習アルゴリズム2005

Author(s)

Journal Title

NAID

Related Report

[Journal Article] モデル補間による発話スタイル・感情表現の制御の検討2005

Author(s)

Journal Title

Related Report

[Journal Article] HMM音声合成におけるESATアルゴリズムを用いたモデル適応および適応学習の検討2005

Author(s)

Journal Title

Related Report

[Journal Article] HMM音声合成における決定木の分割停止基準の検討2005

Author(s)

山岸順一東京工業大学, 大学院・総合理工学研究科, 特別研究員(DC1)