平均声に基づく多様な声質・発話スタイルが可能な音声インタラクションシステム

研究課題

研究課題/領域番号	13878070
研究種目	萌芽研究
配分区分	補助金
研究分野	情報システム学(含情報図書館学)
研究機関	東京工業大学
研究代表者	小林隆夫東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)
研究分担者	益子貴史東京工業大学, 大学院・総合理工学研究科, 助手 (90272715) 徳田恵一名古屋工業大学, 工学部, 助教授 (20217483)
研究期間 (年度)	2001 – 2002
研究課題ステータス	完了 (2002年度)
配分額 *注記	2,000千円 (直接経費: 2,000千円) 2002年度: 800千円 (直接経費: 800千円) 2001年度: 1,200千円 (直接経費: 1,200千円)
キーワード	テキスト音声合成 / 平均声 / 共有決定木 / コンテキストクラスタリング / HMM音声合成 / 話者適応 / 発話様式 / モデル補間 / 隠れマルコフモデル(HMM) / 平均声HMM
研究概要	本研究では,「平均声からの音声合成」という新たな枠組みを提案し,多様な話者の声質や発話様式を自動的に生成可能なマルチモーダルヒューマンコンピュータインタラクションを実現するための基礎を開拓することを目的として,研究初年度に引き続き以下の項目について検討を行った。 1.複数の話者の平均的な声の特徴を表す音声単位である平均声モデルの学習法として,初年度に提案した共有決定木コンテキストクラリング(STC)および話者適応学習(SAT)の二つの方法を統合し,話者の性別や学習データ量の大小による影響を低減する新たな平均声モデル学習法を提案した。そして,平均声の音声合成とその評価実験および任意話者が発声した少量の音声データを用いて平均声モデルを話者適応した適応モデルからの音声合成とその評価実験により,従来法に比較して提案法による合成音声の品質が向上し,目標話者の大量の学習データに基づく話者依存モデルに近い合成音声が得られることを示した。さらに,平均声の学習法として,声道長正規化に基づく手法を提案し,その有効性の検討を行った。 2.多様な発話様式の合成に向けて,「丁寧」,「ぞんざい」,「楽しげ」,「悲嘆」という異なる様式で発声された音声データベースを作成し,HMM音声合成の枠組みによる音声単位のモデル化と合成音声の評価を行った。その結果,それぞれのデータベース中の発話様式を反映した音声が合成可能なこと,各様式に対応するモデルを補間することにより,中間的な様式の音声が合成できることを明らかにした。 3.インタラクションシステムのプラットホームとして,本研究担当者が開発に加わっている「擬人化音声対話エージェント基本ソフトウェア」を利用し,平均声モデルを話者適応したモデルから多様な声質での音声出力が可能なシステムの検討を行った。

報告書

(2件)

2002 実績報告書
2001 実績報告書

研究成果
(14件)

すべてその他

すべて文献書誌 (14件)

[文献書誌] Yamagishi, Junichi: "A context clustering technique for average voice models"IEICE Transactions on Information and Systems. E86-D・3. 534-542 (2003)
- 関連する報告書
  2002 実績報告書
[文献書誌] 田村, 正統: "HMMに基づく音声合成におけるピッチ・スペクトルの話者適応"電子情報通信学会論文誌. J85-D-II・4. 545-553 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] Yamagishi, Junichi: "A context clustering technique for average voice model in HMM-based speech synthesis"Proceeddings of the 7th International Conference on Spoken Language Processing, ICSLP2002. 1. 133-136 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] 大西, 浩二: "HMM音声合成における異なる発話スタイルの生成の検討"電子情報通信学会技術研究報告. 102・619. 17-22 (2003)
- 関連する報告書
  2002 実績報告書
[文献書誌] 山岸順一: "平均声モデル構築のためのコンテキストクラスタリング手法の検討"電子情報通信学会技術研究報告. 102・292. 5-10 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] 山岸順一: "話者適応のための平均声モデル学習法の評価"日本音響学会2002年秋季研究発表会講演論文集. I. 353-354 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] 田村正統, 益子貴史, 徳田恵一, 小林隆夫: "HMM音声合成におけるMLLRを用いたピッチ・スペクトルの話者適応"電子情報通信学会技術研究報告. SP2001-11. 15-20 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] M.Tamura, T.Masuko, K.Tokuda, T.Kobayashi: "Text-to-speech synthesis with arbitrary speaker's voice from average voice"Proceeding of the 7th European Conference on Speech Communication and Technology, EUROSPEECH 2001. I. 345-348 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] 吉岡元貴, 田村正統, 益子貴史, 小林隆夫, 徳田恵一: "HMM音声合成に用いるコンテキストの検討"日本音響学会2001年秋季研究発表会講演論文集. 3-2-5. 313-314 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] 田村正統, 益子貴史, 小林隆夫, 徳田恵一: "HMMに基づく音声合成システムにおける音韻継続長の話者適応"日本音響学会2001年秋季研究発表会講演論文集. 3-2-7. 317-318 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] 吉岡元貴, 田村正統, 益子貴史, 小林隆夫, 徳田恵一: "HMM音声合成における韻律の変動要因の検討"電子情報通信学会技術研究報告. SP2001-80. 51-56 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] 山岸順一, 田村正統, 益子貴史, 小林隆夫, 徳田恵一: "HMM音声合成におけるコンテキストクラスタリング決定木の構築法の検討"日本音響学会2002年春季研究発表会講演論文集. 1-10-1(発表予定). (2002)
- 関連する報告書
  2001 実績報告書
[文献書誌] 田村正統, 益子貴史, 徳田恵一, 小林隆夫: "HMM音声合成におけるSATを用いた平均声モデルの学習"日本音響学会2002年春季研究発表会講演論文集. 1-10-17(発表予定). (2002)
- 関連する報告書
  2001 実績報告書
[文献書誌] 山岸順一, 田村正統, 益子貴史, 小林隆夫, 徳田恵一: "HMM音声合成における平均声モデルの学習セットの検討"日本音響学会2002年春季研究発表会講演論文集. 3-2-10. 323-324 (2001)
- 関連する報告書
  2001 実績報告書

平均声に基づく多様な声質・発話スタイルが可能な音声インタラクションシステム

研究代表者

小林 隆夫 東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)

2,000千円 (直接経費: 2,000千円)

報告書

研究成果

[文献書誌] Yamagishi, Junichi: "A context clustering technique for average voice models"IEICE Transactions on Information and Systems. E86-D・3. 534-542 (2003)

関連する報告書

[文献書誌] 田村, 正統: "HMMに基づく音声合成におけるピッチ・スペクトルの話者適応"電子情報通信学会論文誌. J85-D-II・4. 545-553 (2002)

関連する報告書

[文献書誌] Yamagishi, Junichi: "A context clustering technique for average voice model in HMM-based speech synthesis"Proceeddings of the 7th International Conference on Spoken Language Processing, ICSLP2002. 1. 133-136 (2002)

関連する報告書

[文献書誌] 大西, 浩二: "HMM音声合成における異なる発話スタイルの生成の検討"電子情報通信学会技術研究報告. 102・619. 17-22 (2003)

関連する報告書

[文献書誌] 山岸 順一: "平均声モデル構築のためのコンテキストクラスタリング手法の検討"電子情報通信学会技術研究報告. 102・292. 5-10 (2002)

関連する報告書

[文献書誌] 山岸 順一: "話者適応のための平均声モデル学習法の評価"日本音響学会2002年秋季研究発表会講演論文集. I. 353-354 (2002)

関連する報告書

[文献書誌] 田村正統, 益子貴史, 徳田恵一, 小林隆夫: "HMM音声合成におけるMLLRを用いたピッチ・スペクトルの話者適応"電子情報通信学会技術研究報告. SP2001-11. 15-20 (2001)

関連する報告書

[文献書誌] M.Tamura, T.Masuko, K.Tokuda, T.Kobayashi: "Text-to-speech synthesis with arbitrary speaker's voice from average voice"Proceeding of the 7th European Conference on Speech Communication and Technology, EUROSPEECH 2001. I. 345-348 (2001)

関連する報告書

[文献書誌] 吉岡元貴, 田村正統, 益子貴史, 小林隆夫, 徳田恵一: "HMM音声合成に用いるコンテキストの検討"日本音響学会2001年秋季研究発表会講演論文集. 3-2-5. 313-314 (2001)

関連する報告書

[文献書誌] 田村正統, 益子貴史, 小林隆夫, 徳田恵一: "HMMに基づく音声合成システムにおける音韻継続長の話者適応"日本音響学会2001年秋季研究発表会講演論文集. 3-2-7. 317-318 (2001)

関連する報告書

[文献書誌] 吉岡元貴, 田村正統, 益子貴史, 小林隆夫, 徳田恵一: "HMM音声合成における韻律の変動要因の検討"電子情報通信学会技術研究報告. SP2001-80. 51-56 (2001)

関連する報告書

[文献書誌] 山岸順一, 田村正統, 益子貴史, 小林隆夫, 徳田恵一: "HMM音声合成におけるコンテキストクラスタリング決定木の構築法の検討"日本音響学会2002年春季研究発表会講演論文集. 1-10-1(発表予定). (2002)

関連する報告書

[文献書誌] 田村正統, 益子貴史, 徳田恵一, 小林隆夫: "HMM音声合成におけるSATを用いた平均声モデルの学習"日本音響学会2002年春季研究発表会講演論文集. 1-10-17(発表予定). (2002)

関連する報告書

[文献書誌] 山岸順一, 田村正統, 益子貴史, 小林隆夫, 徳田恵一: "HMM音声合成における平均声モデルの学習セットの検討"日本音響学会2002年春季研究発表会講演論文集. 3-2-10. 323-324 (2001)

関連する報告書

小林隆夫東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)

[文献書誌] 山岸順一: "平均声モデル構築のためのコンテキストクラスタリング手法の検討"電子情報通信学会技術研究報告. 102・292. 5-10 (2002)

[文献書誌] 山岸順一: "話者適応のための平均声モデル学習法の評価"日本音響学会2002年秋季研究発表会講演論文集. I. 353-354 (2002)