• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

Harnessing Latent Variation in DNN-Based Speech Synthesis

研究課題

研究課題/領域番号 17K12720
研究種目

若手研究(B)

配分区分基金
研究分野 知覚情報処理
研究機関国立情報学研究所

研究代表者

Henter Gustav  国立情報学研究所, コンテンツ科学研究系, 特任研究員 (30793096)

研究期間 (年度) 2017-04-01 – 2018-03-31
研究課題ステータス 中途終了 (2017年度)
配分額 *注記
3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2018年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2017年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
キーワードSpeech synthesis / Latent variables / Controllable synthesis / Deep learning / Emotional speech / 音声合成 / ディープラーニング / 潜在変数 / 制御
研究実績の概要

With this grant, I have derived and published theoretical connections between common (heuristic) practical methods for unsupervised learning of controllable speech synthesisers, and latent variables in Bayesian probability, including how common extensions of the practical approach can be given a probabilistic interpretation. Related work (published as well as submitted) explored the optimal supervised methods for annotating the same data, and (separately) considered speech synthesis with multilingual phonetic control. A listening test is currently comparing the aforementioned supervised and unsupervised approaches against variational autoencoders (VAE) and a journal manuscript with the results, and new theoretical connections between VAE and common synthesis heuristics, is in preparation.

報告書

(1件)
  • 2017 実績報告書
  • 研究成果

    (3件)

すべて 2018 2017

すべて 学会発表 (3件) (うち国際学会 2件)

  • [学会発表] Cyborg speech: Deep multilingual speech synthesis for generating segmental foreign accent with natural prosody2018

    • 著者名/発表者名
      Gustav Eje Henter, Jaime Lorenzo-Trueba, Xin Wang, Mariko Kondo, Junichi Yamagishi
    • 学会等名
      IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
    • 発表場所
      Calgary, Alberta, Canada
    • 年月日
      2018-04-15
    • 関連する報告書
      2017 実績報告書
    • 国際学会
  • [学会発表] Generating segment-level foreign-accented synthetic speech with natural speech prosody2018

    • 著者名/発表者名
      Gustav Eje Henter, Jaime Lorenzo-Trueba, Xin Wang, Mariko Kondo, Junichi Yamagishi
    • 学会等名
      第120回音声言語情報処理合同研究発表会
    • 発表場所
      筑波山江戸屋(茨城県・つくば市)
    • 年月日
      2018-02-20
    • 関連する報告書
      2017 実績報告書
  • [学会発表] Principles for learning controllable TTS from annotated and latent variation2017

    • 著者名/発表者名
      Gustav Eje Henter, Jaime Lorenzo-Trueba, Xin Wang, Junichi Yamagishi
    • 学会等名
      Annual Conference of the International Speech Communication Association (Interspeech)
    • 発表場所
      Stockholm, Sweden
    • 年月日
      2017-08-20
    • 関連する報告書
      2017 実績報告書
    • 国際学会

URL: 

公開日: 2017-04-28   更新日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi