• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

ガウス過程回帰に基づく音声合成技術の確立

研究課題

研究課題/領域番号 15H02724
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 知覚情報処理
研究機関東京工業大学

研究代表者

小林 隆夫  東京工業大学, 工学院, 教授 (70153616)

研究分担者 郡山 知樹  東京工業大学, 工学院, 助教 (50749124)
研究協力者 Moungsri Decha  
長濱 大樹  
能勢 隆  
Arifianto Dhany  
研究期間 (年度) 2015-04-01 – 2018-03-31
研究課題ステータス 完了 (2017年度)
配分額 *注記
13,000千円 (直接経費: 10,000千円、間接経費: 3,000千円)
2017年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2016年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2015年度: 4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
キーワードテキスト音声合成 / 統計的パラメトリック音声合成 / 韻律生成 / ガウス過程回帰 / GPR音声合成 / HMM音声合成 / 機械学習 / 深層学習 / 音声情報処理 / 深層ガウス過程
研究成果の概要

多様で表情豊かな音声合成の実現に向け,統計的パラメトリック音声合成の新たな枠組みであるガウス過程回帰に基づく音声合成(GPR音声合成)技術の確立をめざして研究を行った。ガウス過程回帰に基づいたスペクトルパラメータ生成に加え,基本周波数および音韻継続長予測からなる韻律生成手法を提案し,GPR音声合成システムを構築した。評価実験を通してGPR音声合成手法の有効性を示すとともに,多様な話者性やスタイルによる音声合成への応用,従来手法では合成音声の韻律の自然性が不十分であった声調言語への適用を検討し,提案手法の有用性を示した。

報告書

(4件)
  • 2017 実績報告書   研究成果報告書 ( PDF )
  • 2016 実績報告書
  • 2015 実績報告書
  • 研究成果

    (49件)

すべて 2018 2017 2016 2015

すべて 雑誌論文 (25件) (うち査読あり 9件、 オープンアクセス 5件、 謝辞記載あり 17件) 学会発表 (24件) (うち国際学会 7件、 招待講演 1件)

  • [雑誌論文] GPR-based Thai speech synthesis using multi-level duration prediction2018

    • 著者名/発表者名
      Decha Moungsri, Tomoki Koriyama, Takao Kobayashi
    • 雑誌名

      Speech Communication

      巻: 99 ページ: 114-123

    • DOI

      10.1016/j.specom.2018.03.005

    • 関連する報告書
      2017 実績報告書
    • 査読あり
  • [雑誌論文] GP-DNNハイブリッドモデルに基づく統計的音声合成の検討2018

    • 著者名/発表者名
      郡山知樹, 小林隆夫
    • 雑誌名

      電子情報通信学会技術研究報告(SP)

      巻: 117(393) ページ: 5-10

    • NAID

      40021473756

    • 関連する報告書
      2017 実績報告書
  • [雑誌論文] GPR音声合成における深層ガウス過程の利用の検討2018

    • 著者名/発表者名
      郡山知樹, 小林隆夫
    • 雑誌名

      電子情報通信学会技術研究報告(SP)

      巻: 117(517) ページ: 27-32

    • NAID

      120006705503

    • 関連する報告書
      2017 実績報告書
  • [雑誌論文] GPR音声合成における区分線形変換を用いたスタイル適応のためのデータ分割法の検討2018

    • 著者名/発表者名
      前野雄也, 郡山知樹, 小林隆夫
    • 雑誌名

      日本音響学会2018年春季研究発表会講演論文集

      巻: - ページ: 295-296

    • 関連する報告書
      2017 実績報告書
  • [雑誌論文] GPR音声合成における深層構造の利用の検討2018

    • 著者名/発表者名
      郡山知樹, 小林隆夫
    • 雑誌名

      日本音響学会2018年春季研究発表会講演論文集

      巻: - ページ: 1507-1508

    • NAID

      120006705491

    • 関連する報告書
      2017 実績報告書
  • [雑誌論文] クロスリンガル音声合成のための共有決定木コンテクストクラスタリングを用いた話者適応2017

    • 著者名/発表者名
      長濱大樹, 能勢隆, 郡山知樹, 小林隆夫
    • 雑誌名

      電子情報通信学会論文誌D 情報・システム

      巻: J100-D 号: 3 ページ: 385-393

    • DOI

      10.14923/transinfj.2016PDP0020

    • ISSN
      1880-4535, 1881-0225
    • 年月日
      2017-03-01
    • 関連する報告書
      2016 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] Enhanced F0 generation for GPR-based speech synthesis considering syllable-based prosodic features2017

    • 著者名/発表者名
      Decha Moungsri, Tomoki Koriyama, Takao Kobayashi
    • 雑誌名

      Proceedings of APSIPA Annual Summit and Conference 2017

      巻: - ページ: 1-4

    • 関連する報告書
      2017 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] GPR音声合成のためのフレームコンテキストカーネルに基づく決定木構築の検討2017

    • 著者名/発表者名
      郡山知樹, 小林隆夫
    • 雑誌名

      日本音響学会2017年秋季研究発表会講演論文集

      巻: - ページ: 177-178

    • NAID

      120006705316

    • 関連する報告書
      2017 実績報告書
  • [雑誌論文] ガウス過程回帰に基づく歌声合成の検討2017

    • 著者名/発表者名
      郡山知樹, 岡野祐紀, 小林隆夫
    • 雑誌名

      日本音響学会2017年秋季研究発表会講演論文集

      巻: - ページ: 295-296

    • NAID

      120006705394

    • 関連する報告書
      2017 実績報告書
  • [雑誌論文] Duration prediction using multiple Gaussian process experts for GPR-based speech synthesis2017

    • 著者名/発表者名
      Decha Moungsri, Tomoki Koriyama, Takao Kobayashi
    • 雑誌名

      Proc. 2017 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2017)

      巻: - ページ: 5945-5948

    • 関連する報告書
      2016 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] アクセント情報自動ラベリングの音声合成品質への影響に関する検討2017

    • 著者名/発表者名
      増子理菜, 郡山知樹, 小林隆夫
    • 雑誌名

      日本音響学会2017年春季研究発表会講演論文集

      巻: CD-ROM ページ: 283-284

    • 関連する報告書
      2016 実績報告書
    • 謝辞記載あり
  • [雑誌論文] GPR音声合成に基づいたオーディオブック音声の合成2017

    • 著者名/発表者名
      津野駿幸, 郡山知樹, 小林隆夫
    • 雑誌名

      日本音響学会2017年春季研究発表会講演論文集

      巻: CD-ROM ページ: 295-296

    • 関連する報告書
      2016 実績報告書
    • 謝辞記載あり
  • [雑誌論文] コンテキストを考慮した音素マッチングに基づく非パラレルデータGMM声質変換2017

    • 著者名/発表者名
      高橋亮, 郡山知樹, 小林隆夫
    • 雑誌名

      日本音響学会2017年春季研究発表会講演論文集

      巻: CD-ROM ページ: 367-368

    • 関連する報告書
      2016 実績報告書
    • 謝辞記載あり
  • [雑誌論文] Tone modeling using Gaussian process latent variable model for statistical speech synthesis2016

    • 著者名/発表者名
      Decha Moungsri, Tomoki Koriyama, Takao Kobayashi
    • 雑誌名

      Proc. the 8th International Conference on Speech Prosody (SPEECH PROSODY 2016)

      巻: - ページ: 1014-1018

    • DOI

      10.21437/speechprosody.2016-208

    • 関連する報告書
      2016 実績報告書
    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] Unsupervised stress information labeling using Gaussian process latent variable model for statistical speech synthesis2016

    • 著者名/発表者名
      Decha Moungsri, Tomoki Koriyama, Takao Kobayashi
    • 雑誌名

      Proc. 17th Annual Conference of the International Speech Communication Association (INTERSPEECH 2016)

      巻: - ページ: 1591-1595

    • DOI

      10.21437/interspeech.2016-273

    • 関連する報告書
      2016 実績報告書
    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] GPR音声合成における区分線形特徴量変換を用いたスタイル適応の検討2016

    • 著者名/発表者名
      前野雄也, 郡山知樹, 小林隆夫
    • 雑誌名

      日本音響学会2016年秋季研究発表会講演論文集

      巻: CD-ROM ページ: 213-214

    • 関連する報告書
      2016 実績報告書
    • 謝辞記載あり
  • [雑誌論文] 非パラレルデータを用いるGMM声質変換の検討2016

    • 著者名/発表者名
      高橋亮, 郡山知樹, 小林隆夫
    • 雑誌名

      日本音響学会2016年秋季研究発表会講演論文集

      巻: CD-ROM ページ: 267-268

    • 関連する報告書
      2016 実績報告書
    • 謝辞記載あり
  • [雑誌論文] A speaker adaptation technique for Gaussian process regression based speech synthesis using feature space transform2016

    • 著者名/発表者名
      Tomoki Koriyama, Syohei Oshio, Takao Kobayashi
    • 雑誌名

      Proc. 2016 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)

      巻: ICASSP ページ: 5610-5614

    • NAID

      120006704514

    • 関連する報告書
      2015 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] 音声合成のためのCRF/HMMに基づく自動アクセント推定の評価2016

    • 著者名/発表者名
      増子 理菜, 郡山 知樹, 小林 隆夫
    • 雑誌名

      電子情報通信学会技術研究報告〔音声〕

      巻: 115/SP2015-85 ページ: 1-6

    • 関連する報告書
      2015 実績報告書
    • 謝辞記載あり
  • [雑誌論文] GPR音声合成におけるスタイル適応の検討2016

    • 著者名/発表者名
      前野 雄也, 郡山 知樹, 小林 隆夫
    • 雑誌名

      日本音響学会2016年春季研究発表会講演論文集

      巻: CD-ROM ページ: 233-234

    • 関連する報告書
      2015 実績報告書
    • 謝辞記載あり
  • [雑誌論文] 多様なスタイルによるGPR音声合成の検討2016

    • 著者名/発表者名
      岡元 伶洋, 郡山 知樹, 小林 隆夫
    • 雑誌名

      日本音響学会2016年春季研究発表会講演論文集

      巻: CD-ROM ページ: 361-362

    • 関連する報告書
      2015 実績報告書
    • 謝辞記載あり
  • [雑誌論文] Duration prediction using multi-level model for GPR-based speech synthesis2015

    • 著者名/発表者名
      Decha Moungsri, Tomoki Koriyama, Takao Kobayashi
    • 雑誌名

      Proc. 16th Annual Conference of the International Speech Communication Association (INTERSPEECH)

      巻: INTERSPEECH ページ: 1591-1595

    • 関連する報告書
      2015 実績報告書
    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] A comparison of speech synthesis systems based on GPR, HMM, and DNN with a small amount of training data2015

    • 著者名/発表者名
      Tomoki Koriyama, Takao Kobayashi
    • 雑誌名

      Proc. 16th Annual Conference of the International Speech Communication Association (INTERSPEECH)

      巻: INTERSPEECH ページ: 3496-3500

    • 関連する報告書
      2015 実績報告書
    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] GPR音声合成における話者適応手法の検討2015

    • 著者名/発表者名
      押尾 翔平, 郡山 知樹, 小林 隆夫
    • 雑誌名

      日本音響学会2015年秋季研究発表会講演論文集

      巻: CD-ROM ページ: 219-220

    • 関連する報告書
      2015 実績報告書
    • 謝辞記載あり
  • [雑誌論文] ガウス過程回帰に基づく音声合成システムの評価2015

    • 著者名/発表者名
      郡山 知樹, 小林 隆夫
    • 雑誌名

      日本音響学会2015年秋季研究発表会講演論文集

      巻: CD-ROM ページ: 235-236

    • NAID

      120006704045

    • 関連する報告書
      2015 実績報告書
    • 謝辞記載あり
  • [学会発表] GP-DNNハイブリッドモデルに基づく統計的音声合成の検討2018

    • 著者名/発表者名
      郡山知樹
    • 学会等名
      電子情報通信学会音声研究会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] GPR音声合成における深層ガウス過程の利用の検討2018

    • 著者名/発表者名
      郡山知樹
    • 学会等名
      電子情報通信学会音声研究会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] GPR音声合成における区分線形変換を用いたスタイル適応のためのデータ分割法の検討2018

    • 著者名/発表者名
      前野雄也
    • 学会等名
      日本音響学会2018年春季研究発表会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] GPR音声合成における深層構造の利用の検討2018

    • 著者名/発表者名
      郡山知樹
    • 学会等名
      日本音響学会2018年春季研究発表会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] アクセント情報自動ラベリングの音声合成品質への影響に関する検討2017

    • 著者名/発表者名
      増子理菜
    • 学会等名
      日本音響学会2017年春季研究発表会
    • 発表場所
      明治大学生田キャンパス(神奈川県川崎市)
    • 年月日
      2017-03-15
    • 関連する報告書
      2016 実績報告書
  • [学会発表] GPR音声合成に基づいたオーディオブック音声の合成2017

    • 著者名/発表者名
      津野駿幸
    • 学会等名
      日本音響学会2017年春季研究発表会
    • 発表場所
      明治大学生田キャンパス(神奈川県川崎市)
    • 年月日
      2017-03-15
    • 関連する報告書
      2016 実績報告書
  • [学会発表] コンテキストを考慮した音素マッチングに基づく非パラレルデータGMM声質変換2017

    • 著者名/発表者名
      高橋亮
    • 学会等名
      日本音響学会2017年春季研究発表会
    • 発表場所
      明治大学生田キャンパス(神奈川県川崎市)
    • 年月日
      2017-03-15
    • 関連する報告書
      2016 実績報告書
  • [学会発表] Duration prediction using multiple Gaussian process experts for GPR-based speech synthesis2017

    • 著者名/発表者名
      Decha Moungsri
    • 学会等名
      2017 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2017
    • 発表場所
      ヒルトンニューオーリンズリバーサイド(米国)
    • 年月日
      2017-03-05
    • 関連する報告書
      2016 実績報告書
    • 国際学会
  • [学会発表] Enhanced F0 generation for GPR-based speech synthesis considering syllable-based prosodic features2017

    • 著者名/発表者名
      Decha Moungsri
    • 学会等名
      APSIPA Annual Summit and Conference 2017
    • 関連する報告書
      2017 実績報告書
    • 国際学会
  • [学会発表] 表現豊かな音声合成に向けた多様な話者性とスタイルによる音声合成への取組み2017

    • 著者名/発表者名
      小林隆夫
    • 学会等名
      第19回音声言語シンポジウム
    • 関連する報告書
      2017 実績報告書
    • 招待講演
  • [学会発表] GPR音声合成のためのフレームコンテキストカーネルに基づく決定木構築の検討2017

    • 著者名/発表者名
      郡山知樹
    • 学会等名
      日本音響学会2017年秋季研究発表会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] ガウス過程回帰に基づく歌声合成の検討2017

    • 著者名/発表者名
      郡山知樹
    • 学会等名
      日本音響学会2017年秋季研究発表会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] GPR音声合成における区分線形特徴量変換を用いたスタイル適応の検討2016

    • 著者名/発表者名
      前野雄也
    • 学会等名
      日本音響学会2016年秋季研究発表会
    • 発表場所
      富山大学(富山県富山市)
    • 年月日
      2016-09-14
    • 関連する報告書
      2016 実績報告書
  • [学会発表] 非パラレルデータを用いるGMM声質変換の検討2016

    • 著者名/発表者名
      高橋亮
    • 学会等名
      日本音響学会2016年秋季研究発表会
    • 発表場所
      富山大学(富山県富山市)
    • 年月日
      2016-09-14
    • 関連する報告書
      2016 実績報告書
  • [学会発表] Unsupervised stress information labeling using Gaussian process latent variable model for statistical speech synthesis2016

    • 著者名/発表者名
      Decha Moungsri
    • 学会等名
      17th Annual Conference of the International Speech Communication Association, INTERSPEECH 2016
    • 発表場所
      ハイアットリージェンシーサンフランシスコ(米国)
    • 年月日
      2016-09-08
    • 関連する報告書
      2016 実績報告書
    • 国際学会
  • [学会発表] Tone modeling using Gaussian process latent variable model for statistical speech synthesis2016

    • 著者名/発表者名
      Decha Moungsri
    • 学会等名
      the 8th International Conference on Speech Prosody, SPEECH PROSODY 2016
    • 発表場所
      ボストン大学(米国)
    • 年月日
      2016-05-31
    • 関連する報告書
      2016 実績報告書
    • 国際学会
  • [学会発表] A speaker adaptation technique for Gaussian process regression based speech synthesis using feature space transform2016

    • 著者名/発表者名
      郡山 知樹, 小林 隆夫
    • 学会等名
      2016 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2016
    • 発表場所
      上海国際会議中心(中国)
    • 年月日
      2016-03-20
    • 関連する報告書
      2015 実績報告書
    • 国際学会
  • [学会発表] 多様なスタイルによるGPR音声合成の検討2016

    • 著者名/発表者名
      岡元 伶洋, 郡山 知樹, 小林 隆夫
    • 学会等名
      日本音響学会2016年春季研究発表会
    • 発表場所
      桐蔭横浜大学(神奈川県横浜市)
    • 年月日
      2016-03-09
    • 関連する報告書
      2015 実績報告書
  • [学会発表] GPR音声合成におけるスタイル適応の検討2016

    • 著者名/発表者名
      前野 雄也, 郡山 知樹, 小林 隆夫
    • 学会等名
      日本音響学会2016年春季研究発表会
    • 発表場所
      桐蔭横浜大学(神奈川県横浜市)
    • 年月日
      2016-03-09
    • 関連する報告書
      2015 実績報告書
  • [学会発表] 音声合成のためのCRF/HMMに基づく自動アクセント推定の評価2016

    • 著者名/発表者名
      増子 理菜, 郡山 知樹, 小林 隆夫
    • 学会等名
      電子情報通信学会・日本音響学会 音声研究会
    • 発表場所
      サンピアンかわさき(神奈川県川崎市)
    • 年月日
      2016-01-14
    • 関連する報告書
      2015 実績報告書
  • [学会発表] GPR音声合成における話者適応手法の検討2015

    • 著者名/発表者名
      押尾 翔平, 郡山 知樹, 小林 隆夫
    • 学会等名
      日本音響学会2015年秋季研究発表会
    • 発表場所
      会津大学(福島県会津若松市)
    • 年月日
      2015-09-16
    • 関連する報告書
      2015 実績報告書
  • [学会発表] ガウス過程回帰に基づく音声合成システムの評価2015

    • 著者名/発表者名
      郡山 知樹, 小林 隆夫
    • 学会等名
      日本音響学会2015年秋季研究発表会
    • 発表場所
      会津大学(福島県会津若松市)
    • 年月日
      2015-09-16
    • 関連する報告書
      2015 実績報告書
  • [学会発表] Duration prediction using multi-level model for GPR-based speech synthesis2015

    • 著者名/発表者名
      Decha Moungsri, 郡山 知樹, 小林 隆夫
    • 学会等名
      16th Annual Conference of the International Speech Communication Association, INTERSPEECH 2015
    • 発表場所
      ドレスデンインターナショナルコングレスセンター(ドイツ)
    • 年月日
      2015-09-06
    • 関連する報告書
      2015 実績報告書
    • 国際学会
  • [学会発表] A comparison of speech synthesis systems based on GPR, HMM, and DNN with a small amount of training data2015

    • 著者名/発表者名
      郡山 知樹, 小林 隆夫
    • 学会等名
      16th Annual Conference of the International Speech Communication Association, INTERSPEECH 2015
    • 発表場所
      ドレスデンインターナショナルコングレスセンター(ドイツ)
    • 年月日
      2015-09-06
    • 関連する報告書
      2015 実績報告書
    • 国際学会

URL: 

公開日: 2015-04-16   更新日: 2019-03-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi