ガウス過程回帰モデルに基づくノンパラメトリック音声合成の研究

研究課題

研究課題/領域番号	25540065
研究種目	挑戦的萌芽研究
配分区分	基金
研究分野	知覚情報処理
研究機関	東京工業大学
研究代表者	小林隆夫東京工業大学, 総合理工学研究科(研究院), 教授 (70153616)
研究分担者	能勢隆東北大学, 大学院工学研究科, 講師 (90550591)
研究協力者	郡山知樹東京工業大学, 大学院総合理工学研究科, 助教 (50749124)
研究期間 (年度)	2013-04-01 – 2015-03-31
研究課題ステータス	完了 (2014年度)
配分額 *注記	3,770千円 (直接経費: 2,900千円、間接経費: 870千円) 2014年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円) 2013年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード	テキスト音声合成 / 統計的パラメトリック音声合成 / HMM音声合成 / ガウス過程回帰 / カーネル関数 / フレームコンテキスト / 統計的音声合成 / 動的特徴量 / 系列内変動
研究成果の概要	隠れマルコフモデルに基づく音声合成手法の性能の限界を超えて，より多様で自然な合成音声を生成するために，ノンパラメトリックモデルを用いた音声合成手法を確立することをめざして研究を行った。提案する音声合成手法におけるモデル化はガウス過程回帰に基づいており，入力テキストに対してフレーム単位で音声合成に必要なパラメータを予測するためのカーネル関数の設計，計算量削減手法，ハイパーパラメータの自動最適化手法，ガウス過程分類を導入した韻律情報のモデル化手法などの検討を行った。

報告書

(3件)

2014 実績報告書研究成果報告書 ( PDF )
2013 実施状況報告書

研究成果
(21件)

すべて 2015 2014 2013

すべて雑誌論文 (11件) (うち査読あり 5件、謝辞記載あり 7件、オープンアクセス 1件) 学会発表 (10件)

[雑誌論文] ガウス過程回帰に基づく音声合成システムの検討2015
- 著者名/発表者名
  郡山知樹, 小林隆夫
- 雑誌名
  
  日本音響学会2015年春季研究発表会講演論文集
  
  巻: CD-ROM ページ: 269-270
- NAID
  120006703848
- 関連する報告書
  2014 実績報告書
- 謝辞記載あり
[雑誌論文] ガウス過程回帰に基づく音声合成のためのコンテキストの検討2015
- 著者名/発表者名
  岡元伶洋, 郡山知樹, 小林隆夫
- 雑誌名
  
  日本音響学会2015年春季研究発表会講演論文集
  
  巻: CD-ROM ページ: 371-372
- 関連する報告書
  2014 実績報告書
- 謝辞記載あり
[雑誌論文] Prosody generation using frame-based Gaussian process regression and classification for statistical parametric speech synthesis2015
- 著者名/発表者名
  Tomoki Koriyama, Takao Kobayashi
- 雑誌名
  
  Proceedings of 2015 IEEE International Conference on Acoustics, Speech, and Signal Processing
  
  巻: ICASSP 2015 ページ: 4929-4933
- NAID
  120006703851
- 関連する報告書
  2014 実績報告書
- 査読あり / 謝辞記載あり
[雑誌論文] Statistical Parametric Speech Synthesis Based on Gaussian Process Regression2014
- 著者名/発表者名
  Tomoki Koriyama, Takashi Nose, Takao Kobayashi
- 雑誌名
  
  IEEE Journal of Selected Topics in Signal Processing
  
  巻: 8 号: 2 ページ: 173-183
- DOI
  10.1109/jstsp.2013.2283461
- 関連する報告書
  2014 実績報告書
- 査読あり / 謝辞記載あり
[雑誌論文] Parametric speech synthesis based on Gaussian process regression using global variance and hyperparameter optimization2014
- 著者名/発表者名
  Tomoki Koriyama, Takashi Nose, Takao Kobayashi
- 雑誌名
  
  Proceedings of 2014 IEEE International Conference on Acoustics, Speech, and Signal Processing
  
  巻: ICASSP 2014 ページ: 3862-3866
- DOI
  10.1109/icassp.2014.6854319
- NAID
  120006703288
- 関連する報告書
  2014 実績報告書
- 査読あり / 謝辞記載あり
[雑誌論文] Parametric speech synthesis using local and global sparse Gaussian processes2014
- 著者名/発表者名
  Tomoki Koriyama, Takashi Nose, Takao Kobayashi
- 雑誌名
  
  Proceedings of IEEE International Workshop on Machine Learning for Signal Processing
  
  巻: MLSP 2014 ページ: 1-6
- DOI
  10.1109/mlsp.2014.6958921
- NAID
  120006703336
- 関連する報告書
  2014 実績報告書
- 査読あり / オープンアクセス / 謝辞記載あり
[雑誌論文] ガウス過程回帰に基づくF0パタン生成の検討2014
- 著者名/発表者名
  郡山知樹, 能勢隆, 小林隆夫
- 雑誌名
  
  日本音響学会2014年秋季研究発表会講演論文集
  
  巻: CD-ROM ページ: 247-248
- NAID
  120006703360
- 関連する報告書
  2014 実績報告書
- 謝辞記載あり
[雑誌論文] ガウス過程回帰に基づく音声合成におけるハイパーパラメータ最適化の検討2014
- 著者名/発表者名
  郡山知樹, 能勢隆, 小林隆夫
- 雑誌名
  
  電子情報通信学会技術研究報告音声
  
  巻: 113, SP2013-99 ページ: 19-24
- 関連する報告書
  2013 実施状況報告書
[雑誌論文] 系列内変動を考慮したガウス過程回帰に基づく音声パラメータ生成2014
- 著者名/発表者名
  郡山知樹, 能勢隆, 小林隆夫
- 雑誌名
  
  日本音響学会2014年春季研究発表会講演論文集
  
  巻: CD-ROM ページ: 355-356
- NAID
  120006702995
- 関連する報告書
  2013 実施状況報告書
[雑誌論文] Statistical nonparametric speech synthesis using sparse Gaussian processes2013
- 著者名/発表者名
  Tomoki Koriyama, Takashi Nose, Takao Kobayashi
- 雑誌名
  
  Proceedings of the 14th Annual Conference of the International Speech Communication Association, INTERSPEECH 2013
  
  巻: INTERSPEECH 2013 ページ: 1072-1076
- NAID
  120006702716
- 関連する報告書
  2013 実施状況報告書
- 査読あり
[雑誌論文] スパース近似と畳み込みカーネルを用いたガウス過程回帰に基づく音声合成2013
- 著者名/発表者名
  郡山知樹, 能勢隆, 小林隆夫
- 雑誌名
  
  日本音響学会2013年秋季研究発表会講演論文集
  
  巻: CD-ROM ページ: 311-312
- NAID
  120006702748
- 関連する報告書
  2013 実施状況報告書
[学会発表] Prosody generation using frame-based Gaussian process regression and classification for statistical parametric speech synthesis2015
- 著者名/発表者名
  Tomoki Koriyama
- 学会等名
  2015 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2015
- 発表場所
  Brisbane Convention & Exhibition Centre（オーストラリア）
- 年月日
  2015-04-19 – 2015-04-24
- 関連する報告書
  2014 実績報告書
[学会発表] ガウス過程回帰に基づく音声合成システムの検討2015
- 著者名/発表者名
  郡山知樹
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学後楽園キャンパス（東京）
- 年月日
  2015-03-16 – 2015-03-18
- 関連する報告書
  2014 実績報告書
[学会発表] ガウス過程回帰に基づく音声合成のためのコンテキストの検討2015
- 著者名/発表者名
  岡元伶洋
- 学会等名
  本音響学会2015年春季研究発表会
- 発表場所
  中央大学後楽園キャンパス（東京）
- 年月日
  2015-03-16 – 2015-03-18
- 関連する報告書
  2014 実績報告書
[学会発表] Parametric speech synthesis using local and global sparse Gaussian processes2014
- 著者名/発表者名
  Tomoki Koriyama
- 学会等名
  International Workshop on Machine Learning for Signal Processing, MLSP2014
- 発表場所
  Reims Centre De Congres（フランス）
- 年月日
  2014-09-21 – 2014-09-24
- 関連する報告書
  2014 実績報告書
[学会発表] ガウス過程回帰に基づくF0パタン生成の検討2014
- 著者名/発表者名
  郡山知樹
- 学会等名
  日本音響学会2014年秋季研究発表会
- 発表場所
  北海学園大学豊平キャンパス（北海道）
- 年月日
  2014-09-03 – 2014-09-05
- 関連する報告書
  2014 実績報告書
[学会発表] Parametric speech synthesis based on Gaussian process regression using global variance and hyperparameter optimization2014
- 著者名/発表者名
  Tomoki Koriyama
- 学会等名
  2014 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2014
- 発表場所
  "Fortezza Da Basso” Convention & Exhibition Centre （イタリア）
- 年月日
  2014-05-04 – 2014-05-09
- 関連する報告書
  2014 実績報告書
[学会発表] ガウス過程回帰に基づく音声合成におけるハイパーパラメータ最適化の検討2014
- 著者名/発表者名
  郡山知樹
- 学会等名
  電子情報通信学会・日本音響学会音声研究会
- 発表場所
  名城大学天白キャンパス（愛知）
- 関連する報告書
  2013 実施状況報告書
[学会発表] 系列内変動を考慮したガウス過程回帰に基づく音声パラメータ生成2014
- 著者名/発表者名
  郡山知樹
- 学会等名
  日本音響学会2014年春季研究発表会
- 発表場所
  日本大学理工学部駿河台キャンパス（東京）
- 関連する報告書
  2013 実施状況報告書
[学会発表] Statistical nonparametric speech synthesis using sparse Gaussian processes2013
- 著者名/発表者名
  郡山知樹
- 学会等名
  14th Annual Conference of the International Speech Communication Association, INTERSPEECH 2013
- 発表場所
  リヨンコンベンションセンター（フランス）
- 関連する報告書
  2013 実施状況報告書
[学会発表] スパース近似と畳み込みカーネルを用いたガウス過程回帰に基づく音声合成2013
- 著者名/発表者名
  郡山知樹
- 学会等名
  日本音響学会2013年秋季研究発表会
- 発表場所
  豊橋技術科学大学（愛知）
- 関連する報告書
  2013 実施状況報告書

ガウス過程回帰モデルに基づくノンパラメトリック音声合成の研究

研究代表者

小林 隆夫 東京工業大学, 総合理工学研究科(研究院), 教授 (70153616)

3,770千円 (直接経費: 2,900千円、間接経費: 870千円)

報告書

研究成果

[雑誌論文] ガウス過程回帰に基づく音声合成システムの検討2015

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] ガウス過程回帰に基づく音声合成のためのコンテキストの検討2015

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Prosody generation using frame-based Gaussian process regression and classification for statistical parametric speech synthesis2015

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Statistical Parametric Speech Synthesis Based on Gaussian Process Regression2014

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Parametric speech synthesis based on Gaussian process regression using global variance and hyperparameter optimization2014

著者名/発表者名

雑誌名

DOI

NAID

関連する報告書

[雑誌論文] Parametric speech synthesis using local and global sparse Gaussian processes2014

著者名/発表者名

雑誌名

DOI

NAID

関連する報告書

[雑誌論文] ガウス過程回帰に基づくF0パタン生成の検討2014

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] ガウス過程回帰に基づく音声合成におけるハイパーパラメータ最適化の検討2014

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 系列内変動を考慮したガウス過程回帰に基づく音声パラメータ生成2014

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Statistical nonparametric speech synthesis using sparse Gaussian processes2013

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] スパース近似と畳み込みカーネルを用いたガウス過程回帰に基づく音声合成2013

著者名/発表者名

雑誌名

NAID

関連する報告書

[学会発表] Prosody generation using frame-based Gaussian process regression and classification for statistical parametric speech synthesis2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] ガウス過程回帰に基づく音声合成システムの検討2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] ガウス過程回帰に基づく音声合成のためのコンテキストの検討2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Parametric speech synthesis using local and global sparse Gaussian processes2014

小林隆夫東京工業大学, 総合理工学研究科(研究院), 教授 (70153616)