任意の話者性・感情表現・発話様式によるテキスト音声合成の実現

研究課題

研究課題/領域番号	04J04633
研究種目	特別研究員奨励費
配分区分	補助金
応募区分	国内
研究分野	知覚情報処理・知能ロボティクス
研究機関	東京工業大学
研究代表者	山岸順一東京工業大学, 大学院・総合理工学研究科, 特別研究員(DC1)
研究期間 (年度)	2004 – 2006
研究課題ステータス	完了 (2005年度)
配分額 *注記	1,900千円 (直接経費: 1,900千円) 2005年度: 900千円 (直接経費: 900千円) 2004年度: 1,000千円 (直接経費: 1,000千円)
キーワード	音声合成 / 音声信号処理 / 統計的音声情報処理 / 統計的音声合成 / 隠れマルコフモデル / ヒューマンインターフェース / 多様な音声合成 / 感情・発話様式を伴う音声合成 / 感情表現を伴う音声合成 / 多様な発話様式による音声合成 / 統計的音声処理
研究概要	本研究では,任意の話者性・感情表現・発話様式によるテキスト音声合成システムの実現を目標に,平均声と話者適応/スタイル適応技術を組み合わせた新たな音声合成方式の検討を行っている.昨年度は隠れセミマルコフモデルという通常の隠れマルコフモデルを拡張した統計モデルの枠組みを利用することで,スペクトルと基本周波数と音韻継続長という音声の3つの特徴量を同時に変換することが可能な話者適応アルゴリズムを開発し,その有効性を示した.しかし,上記の実験に用いた話者適応アルゴリズムは,最尤線形回帰という隠れマルコフモデルの出力分布の平均ベクトルをアフィン変換するだけの非常に単純な手法であり,より緻密で適切なモデル変換を頑健に行うためには話者適応アルゴリズムの改善が必要である. そこで本年度は,話者適応アルゴリズムの変換精度を向上させることを目的に,様々な話者適応アルゴリズムを隠れセミマルコフモデルの枠組みにおいて再定式化し,音声合成システムへ導入することで昨年度提案した手法との比較検討を行った.新たに検討したモデル適応アルゴリズムとしては,隠れセミマルコフモデルの出力分布の平均ベクトルだけでなく共分散行列も変換を行う制約付き最尤線形回帰や,変換パラメータの推定に最尤推定ではなく事後確率最大化推定を導入することでより少量のデータでも頑健に変換パラメータを推定できるように拡張した事後確率最大化線形回帰などを導入し,比較検討を行った。またこれらの制約付き線形回帰と事後確率最大化線形回帰を組み合わせた新たな話者適応アルゴリズムの開発も行い,話者適応のより一段の精度向上が図れたことを実験結果から確認した.さらにこれらの線形回帰によるモデル変換後に,データサンプルのある分布に対し事後確率最大化推定を行う手法も導入し,話者適応により変換された分布が利用可能なデータ量の増加に従い最尤推定の結果に漸近的に近づいていくことも確認した.この手法により、統一の枠組みで様々なデータ量に適したモデルを作成できる. また,これらの話者適応アルゴリズムを話者の変換ではなく,音声のスタイルの変換に利用するスタイル適応にも応用し,その有効性を検討した.スタイルを伴った音声の適応では基本周波数や音韻継続長が重要な役割を担っていることからこれらのモデル適応アルゴリズムの大きな効果が確認された.

報告書

(2件)

2005 実績報告書
2004 実績報告書

研究成果

(23件)

すべて 2006 2005 2004

すべて雑誌論文 (23件)

[雑誌論文] HSMM-based model adaptation algorithms for average-voice-based speech synthesis2006
- 著者名/発表者名
  J.Yamagishi, K.Ogata, Y.Nakano, J.Isogai, T.Kobayashi
- 雑誌名
  
  Proc. 2006 IEEE International Conference on Acoustics, Speech and Signal Processing (掲載決定)
- 関連する報告書
  2005 実績報告書
[雑誌論文] A style adaptation technique for speech synthesis using HSMM and suprasegmental features2006
- 著者名/発表者名
  M.Tachibana, J.Yamagishi, T.Masuko, T.Kobayashi
- 雑誌名
  
  IEICE Trans. Information and Systems E89-D
  
  ページ: 1092-1099
- 関連する報告書
  2005 実績報告書
[雑誌論文] HSMM音声合成における話者適応とMAPに基づく音響モデル学習法2006
- 著者名/発表者名
  緒方克海, 中野雄資, 山岸順一, 小林隆夫
- 雑誌名
  
  日本音響学会2006年春季研究発表会講演論文集 2-4-19
  
  ページ: 299-300
- 関連する報告書
  2005 実績報告書
[雑誌論文] HMM音声合成のための話者正規化クラスタリングと話者正規化学習2006
- 著者名/発表者名
  山岸順一, 小林隆夫
- 雑誌名
  
  日本音響学会2006年春季研究発表会講演論文集 2-4-20
  
  ページ: 301-302
- 関連する報告書
  2005 実績報告書
[雑誌論文] 平均声に基づく音声合成のための話者適応アルゴリズムの評価2006
- 著者名/発表者名
  中野雄資, 緒方克海, 山岸順一, 小林隆夫
- 雑誌名
  
  日本音響学会2006年春季研究発表会講演論文集 1-Q-26
  
  ページ: 385-386
- 関連する報告書
  2005 実績報告書
[雑誌論文] Model adaptation and adaptive training using ESAT algorithms for HMM-based speech synthesis2005
- 著者名/発表者名
  J.Isogai, J.Yamagishi, T.Kobayashi
- 雑誌名
  
  Proc. 9th European Conference on Speech Communication and Technology
  
  ページ: 2597-2600
- 関連する報告書
  2005 実績報告書
[雑誌論文] Performance evaluation of style adaptation for hidden semi-Markov model based speech synthesis2005
- 著者名/発表者名
  M.Tachibana, J.Yamagishi, T.Masuko, T.Kobayashi
- 雑誌名
  
  Proc. 9th European Conference on Speech Communication and Technology
  
  ページ: 2597-2600
- 関連する報告書
  2005 実績報告書
[雑誌論文] 多様な音声合成のためのモデル適応・適応学習アルゴリズムの検討2005
- 著者名/発表者名
  磯貝朱里, 緒方克海, 中野雄資, 山岸順一, 小林隆夫
- 雑誌名
  
  電子情報通信学会技術研究報告 Vol.105 No.252
  
  ページ: 23-28
- NAID
  110003298750
- 関連する報告書
  2005 実績報告書
[雑誌論文] 隠れセミマルコフモデルに基づく音声合成システムのためのスタイル適応手法の評価2005
- 著者名/発表者名
  橘誠, 山岸順一, 小林隆夫
- 雑誌名
  
  電子情報通信学会技術研究報告 Vol.105 No.252
  
  ページ: 29-34
- NAID
  110003298752
- 関連する報告書
  2005 実績報告書
[雑誌論文] 平均声に基づく音声合成のための話者適応アルゴリズムの検討2005
- 著者名/発表者名
  中野雄資, 緒方克海, 磯貝朱里, 山岸順一, 小林隆夫
- 雑誌名
  
  日本音響学会2005年秋季研究発表会講演論文集 1-Q-11
  
  ページ: 395-396
- 関連する報告書
  2005 実績報告書
[雑誌論文] 多様な音声合成のためのスタイル適応アルゴリズムの比較検討2005
- 著者名/発表者名
  橘誠, 山岸順一, 小林隆夫
- 雑誌名
  
  日本音響学会2005年秋季研究発表会講演論文集 2-6-14
  
  ページ: 289-290
- 関連する報告書
  2005 実績報告書
[雑誌論文] HMM音声合成におけるESATアルゴリズムの評価2005
- 著者名/発表者名
  磯貝朱里, 山岸順一, 小林隆夫
- 雑誌名
  
  日本音響学会2005年秋季研究発表会講演論文集 3-6-23
  
  ページ: 373-374
- 関連する報告書
  2005 実績報告書
[雑誌論文] Acoustic Modeling of Speaking Styles and Emotional Expressions in HMM-based Speech Synthesis2005
- 著者名/発表者名
  山岸順一
- 雑誌名
  
  IEICE Trans. Information and Systems Vol.E88-D, No.3
  
  ページ: 502-509
- NAID
  110003214212
- 関連する報告書
  2004 実績報告書
[雑誌論文] Adaptive training for hidden semi-Markov model2005
- 著者名/発表者名
  山岸順一
- 雑誌名
  
  Proc. the 2005 IEEE International Conference on Acoustics, Speech and Signal Processing (発表予定)
- 関連する報告書
  2004 実績報告書
[雑誌論文] 隠れセミマルコフモデルに基づく適応学習アルゴリズム2005
- 著者名/発表者名
  山岸順一
- 雑誌名
  
  日本音響学会2005年春季研究発表会講演論文集 (発表予定)
- NAID
  10018037428
- 関連する報告書
  2004 実績報告書
[雑誌論文] モデル補間による発話スタイル・感情表現の制御の検討2005
- 著者名/発表者名
  橘誠
- 雑誌名
  
  日本音響学会2005年春季研究発表会講演論文集 (発表予定)
- 関連する報告書
  2004 実績報告書
[雑誌論文] HMM音声合成におけるESATアルゴリズムを用いたモデル適応および適応学習の検討2005
- 著者名/発表者名
  磯貝朱里
- 雑誌名
  
  日本音響学会2005年春季研究発表会講演論文集 (発表予定)
- 関連する報告書
  2004 実績報告書
[雑誌論文] HMM音声合成における決定木の分割停止基準の検討2005
- 著者名/発表者名
  野村大輔
- 雑誌名
  
  日本音響学会2005年春季研究発表会講演論文集 (発表予定)
- 関連する報告書
  2004 実績報告書
[雑誌論文] MLLR adaptation for hidden semi-Markov model based speech synthesis2004
- 著者名/発表者名
  山岸順一
- 雑誌名
  
  Proc. the 8th International Conference on Spoken Language 2004
- 関連する報告書
  2004 実績報告書
[雑誌論文] Speaking style adaptation using context clustering decision tree for HMM-based speech synthesis2004
- 著者名/発表者名
  山岸順一
- 雑誌名
  
  Proc. the 2004 IEEE International Conference on Acoustics, Speech and Signal Processing Vol.I
  
  ページ: 5-8
- 関連する報告書
  2004 実績報告書
[雑誌論文] 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰よるスタイル適応の検討2004
- 著者名/発表者名
  山岸順二
- 雑誌名
  
  電子情報通信学会技術研究報告 vol.104
  
  ページ: 13-18
- 関連する報告書
  2004 実績報告書
[雑誌論文] 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰の検討2004
- 著者名/発表者名
  山岸順一
- 雑誌名
  
  日本音響学会2004年秋季研究発表会講演論文集 I
  
  ページ: 331-332
- 関連する報告書
  2004 実績報告書
[雑誌論文] 隠れセミマルコフモデルに基づく音声合成におけるスタイル適応の評価2004
- 著者名/発表者名
  橘誠
- 雑誌名
  
  日本音響学会2004年秋季研究発表会講演論文集 I
  
  ページ: 333-334
- 関連する報告書
  2004 実績報告書

任意の話者性・感情表現・発話様式によるテキスト音声合成の実現

研究代表者

山岸 順一 東京工業大学, 大学院・総合理工学研究科, 特別研究員(DC1)

1,900千円 (直接経費: 1,900千円)

報告書

研究成果

[雑誌論文] HSMM-based model adaptation algorithms for average-voice-based speech synthesis2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A style adaptation technique for speech synthesis using HSMM and suprasegmental features2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] HSMM音声合成における話者適応とMAPに基づく音響モデル学習法2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] HMM音声合成のための話者正規化クラスタリングと話者正規化学習2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 平均声に基づく音声合成のための話者適応アルゴリズムの評価2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Model adaptation and adaptive training using ESAT algorithms for HMM-based speech synthesis2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Performance evaluation of style adaptation for hidden semi-Markov model based speech synthesis2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 多様な音声合成のためのモデル適応・適応学習アルゴリズムの検討2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 隠れセミマルコフモデルに基づく音声合成システムのためのスタイル適応手法の評価2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 平均声に基づく音声合成のための話者適応アルゴリズムの検討2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 多様な音声合成のためのスタイル適応アルゴリズムの比較検討2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] HMM音声合成におけるESATアルゴリズムの評価2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Acoustic Modeling of Speaking Styles and Emotional Expressions in HMM-based Speech Synthesis2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Adaptive training for hidden semi-Markov model2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 隠れセミマルコフモデルに基づく適応学習アルゴリズム2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] モデル補間による発話スタイル・感情表現の制御の検討2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] HMM音声合成におけるESATアルゴリズムを用いたモデル適応および適応学習の検討2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] HMM音声合成における決定木の分割停止基準の検討2005

著者名/発表者名

山岸順一東京工業大学, 大学院・総合理工学研究科, 特別研究員(DC1)