• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

ガウス過程回帰モデルに基づくノンパラメトリック音声合成の研究

研究課題

研究課題/領域番号 25540065
研究種目

挑戦的萌芽研究

配分区分基金
研究分野 知覚情報処理
研究機関東京工業大学

研究代表者

小林 隆夫  東京工業大学, 総合理工学研究科(研究院), 教授 (70153616)

研究分担者 能勢 隆  東北大学, 大学院工学研究科, 講師 (90550591)
研究協力者 郡山 知樹  東京工業大学, 大学院総合理工学研究科, 助教 (50749124)
研究期間 (年度) 2013-04-01 – 2015-03-31
研究課題ステータス 完了 (2014年度)
配分額 *注記
3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
2014年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2013年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワードテキスト音声合成 / 統計的パラメトリック音声合成 / HMM音声合成 / ガウス過程回帰 / カーネル関数 / フレームコンテキスト / 統計的音声合成 / 動的特徴量 / 系列内変動
研究成果の概要

隠れマルコフモデルに基づく音声合成手法の性能の限界を超えて,より多様で自然な合成音声を生成するために,ノンパラメトリックモデルを用いた音声合成手法を確立することをめざして研究を行った。提案する音声合成手法におけるモデル化はガウス過程回帰に基づいており,入力テキストに対してフレーム単位で音声合成に必要なパラメータを予測するためのカーネル関数の設計,計算量削減手法,ハイパーパラメータの自動最適化手法,ガウス過程分類を導入した韻律情報のモデル化手法などの検討を行った。

報告書

(3件)
  • 2014 実績報告書   研究成果報告書 ( PDF )
  • 2013 実施状況報告書
  • 研究成果

    (21件)

すべて 2015 2014 2013

すべて 雑誌論文 (11件) (うち査読あり 5件、 謝辞記載あり 7件、 オープンアクセス 1件) 学会発表 (10件)

  • [雑誌論文] ガウス過程回帰に基づく音声合成システムの検討2015

    • 著者名/発表者名
      郡山知樹, 小林隆夫
    • 雑誌名

      日本音響学会2015年春季研究発表会講演論文集

      巻: CD-ROM ページ: 269-270

    • NAID

      120006703848

    • 関連する報告書
      2014 実績報告書
    • 謝辞記載あり
  • [雑誌論文] ガウス過程回帰に基づく音声合成のためのコンテキストの検討2015

    • 著者名/発表者名
      岡元伶洋, 郡山知樹, 小林隆夫
    • 雑誌名

      日本音響学会2015年春季研究発表会講演論文集

      巻: CD-ROM ページ: 371-372

    • 関連する報告書
      2014 実績報告書
    • 謝辞記載あり
  • [雑誌論文] Prosody generation using frame-based Gaussian process regression and classification for statistical parametric speech synthesis2015

    • 著者名/発表者名
      Tomoki Koriyama, Takao Kobayashi
    • 雑誌名

      Proceedings of 2015 IEEE International Conference on Acoustics, Speech, and Signal Processing

      巻: ICASSP 2015 ページ: 4929-4933

    • NAID

      120006703851

    • 関連する報告書
      2014 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] Statistical Parametric Speech Synthesis Based on Gaussian Process Regression2014

    • 著者名/発表者名
      Tomoki Koriyama, Takashi Nose, Takao Kobayashi
    • 雑誌名

      IEEE Journal of Selected Topics in Signal Processing

      巻: 8 号: 2 ページ: 173-183

    • DOI

      10.1109/jstsp.2013.2283461

    • 関連する報告書
      2014 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] Parametric speech synthesis based on Gaussian process regression using global variance and hyperparameter optimization2014

    • 著者名/発表者名
      Tomoki Koriyama, Takashi Nose, Takao Kobayashi
    • 雑誌名

      Proceedings of 2014 IEEE International Conference on Acoustics, Speech, and Signal Processing

      巻: ICASSP 2014 ページ: 3862-3866

    • DOI

      10.1109/icassp.2014.6854319

    • NAID

      120006703288

    • 関連する報告書
      2014 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] Parametric speech synthesis using local and global sparse Gaussian processes2014

    • 著者名/発表者名
      Tomoki Koriyama, Takashi Nose, Takao Kobayashi
    • 雑誌名

      Proceedings of IEEE International Workshop on Machine Learning for Signal Processing

      巻: MLSP 2014 ページ: 1-6

    • DOI

      10.1109/mlsp.2014.6958921

    • NAID

      120006703336

    • 関連する報告書
      2014 実績報告書
    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] ガウス過程回帰に基づくF0パタン生成の検討2014

    • 著者名/発表者名
      郡山知樹, 能勢 隆, 小林隆夫
    • 雑誌名

      日本音響学会2014年秋季研究発表会講演論文集

      巻: CD-ROM ページ: 247-248

    • NAID

      120006703360

    • 関連する報告書
      2014 実績報告書
    • 謝辞記載あり
  • [雑誌論文] ガウス過程回帰に基づく音声合成におけるハイパーパラメータ最適化の検討2014

    • 著者名/発表者名
      郡山知樹, 能勢 隆, 小林隆夫
    • 雑誌名

      電子情報通信学会技術研究報告 音声

      巻: 113, SP2013-99 ページ: 19-24

    • 関連する報告書
      2013 実施状況報告書
  • [雑誌論文] 系列内変動を考慮したガウス過程回帰に基づく音声パラメータ生成2014

    • 著者名/発表者名
      郡山知樹, 能勢 隆, 小林隆夫
    • 雑誌名

      日本音響学会2014年春季研究発表会講演論文集

      巻: CD-ROM ページ: 355-356

    • NAID

      120006702995

    • 関連する報告書
      2013 実施状況報告書
  • [雑誌論文] Statistical nonparametric speech synthesis using sparse Gaussian processes2013

    • 著者名/発表者名
      Tomoki Koriyama, Takashi Nose, Takao Kobayashi
    • 雑誌名

      Proceedings of the 14th Annual Conference of the International Speech Communication Association, INTERSPEECH 2013

      巻: INTERSPEECH 2013 ページ: 1072-1076

    • NAID

      120006702716

    • 関連する報告書
      2013 実施状況報告書
    • 査読あり
  • [雑誌論文] スパース近似と畳み込みカーネルを用いたガウス過程回帰に基づく音声合成2013

    • 著者名/発表者名
      郡山知樹, 能勢 隆, 小林隆夫
    • 雑誌名

      日本音響学会2013年秋季研究発表会講演論文集

      巻: CD-ROM ページ: 311-312

    • NAID

      120006702748

    • 関連する報告書
      2013 実施状況報告書
  • [学会発表] Prosody generation using frame-based Gaussian process regression and classification for statistical parametric speech synthesis2015

    • 著者名/発表者名
      Tomoki Koriyama
    • 学会等名
      2015 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2015
    • 発表場所
      Brisbane Convention & Exhibition Centre(オーストラリア)
    • 年月日
      2015-04-19 – 2015-04-24
    • 関連する報告書
      2014 実績報告書
  • [学会発表] ガウス過程回帰に基づく音声合成システムの検討2015

    • 著者名/発表者名
      郡山 知樹
    • 学会等名
      日本音響学会2015年春季研究発表会
    • 発表場所
      中央大学後楽園キャンパス(東京)
    • 年月日
      2015-03-16 – 2015-03-18
    • 関連する報告書
      2014 実績報告書
  • [学会発表] ガウス過程回帰に基づく音声合成のためのコンテキストの検討2015

    • 著者名/発表者名
      岡元 伶洋
    • 学会等名
      本音響学会2015年春季研究発表会
    • 発表場所
      中央大学後楽園キャンパス(東京)
    • 年月日
      2015-03-16 – 2015-03-18
    • 関連する報告書
      2014 実績報告書
  • [学会発表] Parametric speech synthesis using local and global sparse Gaussian processes2014

    • 著者名/発表者名
      Tomoki Koriyama
    • 学会等名
      International Workshop on Machine Learning for Signal Processing, MLSP2014
    • 発表場所
      Reims Centre De Congres(フランス)
    • 年月日
      2014-09-21 – 2014-09-24
    • 関連する報告書
      2014 実績報告書
  • [学会発表] ガウス過程回帰に基づくF0パタン生成の検討2014

    • 著者名/発表者名
      郡山 知樹
    • 学会等名
      日本音響学会2014年秋季研究発表会
    • 発表場所
      北海学園大学豊平キャンパス (北海道)
    • 年月日
      2014-09-03 – 2014-09-05
    • 関連する報告書
      2014 実績報告書
  • [学会発表] Parametric speech synthesis based on Gaussian process regression using global variance and hyperparameter optimization2014

    • 著者名/発表者名
      Tomoki Koriyama
    • 学会等名
      2014 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2014
    • 発表場所
      "Fortezza Da Basso” Convention & Exhibition Centre (イタリア)
    • 年月日
      2014-05-04 – 2014-05-09
    • 関連する報告書
      2014 実績報告書
  • [学会発表] ガウス過程回帰に基づく音声合成におけるハイパーパラメータ最適化の検討2014

    • 著者名/発表者名
      郡山知樹
    • 学会等名
      電子情報通信学会・日本音響学会 音声研究会
    • 発表場所
      名城大学天白キャンパス(愛知)
    • 関連する報告書
      2013 実施状況報告書
  • [学会発表] 系列内変動を考慮したガウス過程回帰に基づく音声パラメータ生成2014

    • 著者名/発表者名
      郡山知樹
    • 学会等名
      日本音響学会2014年春季研究発表会
    • 発表場所
      日本大学理工学部駿河台キャンパス(東京)
    • 関連する報告書
      2013 実施状況報告書
  • [学会発表] Statistical nonparametric speech synthesis using sparse Gaussian processes2013

    • 著者名/発表者名
      郡山知樹
    • 学会等名
      14th Annual Conference of the International Speech Communication Association, INTERSPEECH 2013
    • 発表場所
      リヨンコンベンションセンター(フランス)
    • 関連する報告書
      2013 実施状況報告書
  • [学会発表] スパース近似と畳み込みカーネルを用いたガウス過程回帰に基づく音声合成2013

    • 著者名/発表者名
      郡山知樹
    • 学会等名
      日本音響学会2013年秋季研究発表会
    • 発表場所
      豊橋技術科学大学(愛知)
    • 関連する報告書
      2013 実施状況報告書

URL: 

公開日: 2014-07-25   更新日: 2019-07-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi