• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

音声制約の自動獲得に基づく高品質音声合成に関する研究

研究課題

研究課題/領域番号 16H06681
研究種目

研究活動スタート支援

配分区分補助金
研究分野 知能情報学
研究機関東京大学

研究代表者

高道 慎之介  東京大学, 大学院情報理工学系研究科, 助教 (90784330)

研究期間 (年度) 2016-08-26 – 2018-03-31
研究課題ステータス 完了 (2017年度)
配分額 *注記
2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2017年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2016年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード音声合成 / アンチ・スプーフィング / 深層学習 / 話者認証 / 音声なりすまし / anti-spoofing / 音声処理 / 音声変換 / 機械学習
研究成果の概要

音声合成技術は,人工的に音声を合成する技術である.合成音声の品質を改善するために,本研究では,敵対的学習を用いた統計的音声合成法を提案した.音質劣化の主要因は,音声パラメータの過剰な平滑化により生じたものである.提案法の学習基準は,通常の基準と敵対基準の重み付き和で得られる.敵対的学習は,自然・合成音声の分布間距離を最小化するため,過剰平滑化を効率的に緩和できる.実験的評価から,(1) 提案法はハイパーパラメータに対して頑健に働くこと,(2) Wasserstein 距離最小化に基づく提案法が,もっとも音質改善効果に有効であること,(3) ボコーダフリー音声合成に展開できることを示す.

報告書

(3件)
  • 2017 実績報告書   研究成果報告書 ( PDF )
  • 2016 実績報告書
  • 研究成果

    (28件)

すべて 2018 2017 2016 その他

すべて 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 3件) 学会発表 (23件) (うち国際学会 6件、 招待講演 1件) 備考 (2件)

  • [雑誌論文] Statistical Parametric Speech Synthesis Incorporating Generative Adversarial Networks2018

    • 著者名/発表者名
      Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processin

      巻: 26 号: 1 ページ: 84-96

    • DOI

      10.1109/taslp.2017.2761547

    • 関連する報告書
      2017 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Voice Conversion Using Input-to-Output Highway Networks2017

    • 著者名/発表者名
      Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E100.D 号: 8 ページ: 1925-1928

    • DOI

      10.1587/transinf.2017EDL8034

    • NAID

      130005876129

    • ISSN
      0916-8532, 1745-1361
    • 関連する報告書
      2017 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Voice conversion using input-to-output highway networks2017

    • 著者名/発表者名
      Yuki Saito, Shinnosuke Takamichi, and Hiroshi Saruwatari
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: Vol.E100-D

    • NAID

      130005876129

    • 関連する報告書
      2016 実績報告書
    • 査読あり / オープンアクセス
  • [学会発表] Text-to-speech synthesis using STFT spectra based on low-/multi-resolution generative adversarial networks2018

    • 著者名/発表者名
      Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari
    • 学会等名
      IEEE ICASSP
    • 関連する報告書
      2017 実績報告書
    • 国際学会
  • [学会発表] Non-parallel voice conversion using variational autoencoders conditioned by phonetic posteriorgrams and d-vectors2018

    • 著者名/発表者名
      Yuki Saito, Yusuke Ijima, Kyosuke Nishida, Shinnosuke Takamichi
    • 学会等名
      IEEE ICASSP
    • 関連する報告書
      2017 実績報告書
    • 国際学会
  • [学会発表] 多重周波数解像度のSTFTスペクトルを用いた敵対的DNN音声合成2018

    • 著者名/発表者名
      齋藤 佑樹, 高道 慎之介, 猿渡 洋
    • 学会等名
      日本音響学会2018年春季研究発表会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] 高品質声質変換のための特徴量分析再訪2018

    • 著者名/発表者名
      須田 仁志, 小谷 岳, 高道 慎之介, 齋藤 大輔
    • 学会等名
      日本音響学会2018年春季研究発表会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] 雑音環境下音声を用いたDNN音声合成のための雑音生成モデルの敵対的学習2018

    • 著者名/発表者名
      宇根 昌和, 齋藤 佑樹, 高道 慎之介, 北村 大地, 宮崎 亮一, 猿渡 洋
    • 学会等名
      日本音響学会2018年春季研究発表会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] GMMに基づく固有声変換のための変調スペクトル制約付きトラジェクトリ学習・適応2017

    • 著者名/発表者名
      高道 慎之介
    • 学会等名
      日本音響学会2017年春季研究発表会
    • 発表場所
      明治大学生田キャンパス(神奈川県)
    • 年月日
      2017-03-15
    • 関連する報告書
      2016 実績報告書
  • [学会発表] Moment matching networkを用いた音声パラメータのランダム生成の検討2017

    • 著者名/発表者名
      高道 慎之介
    • 学会等名
      日本音響学会2017年春季研究発表会
    • 発表場所
      明治大学生田キャンパス(神奈川県)
    • 年月日
      2017-03-15
    • 関連する報告書
      2016 実績報告書
  • [学会発表] コンテキスト事後確率のSequence-to-Sequence学習を用いた音声変換2017

    • 著者名/発表者名
      三好 裕之
    • 学会等名
      日本音響学会2017年春季研究発表会
    • 発表場所
      明治大学生田キャンパス(神奈川県)
    • 年月日
      2017-03-15
    • 関連する報告書
      2016 実績報告書
  • [学会発表] 敵対的DNN音声合成におけるF0・継続長の生成2017

    • 著者名/発表者名
      齋藤 佑樹
    • 学会等名
      日本音響学会2017年春季研究発表会
    • 発表場所
      明治大学生田キャンパス(神奈川県)
    • 年月日
      2017-03-15
    • 関連する報告書
      2016 実績報告書
  • [学会発表] Highway networkを用いた差分スペクトル法に基づく敵対的DNN音声変換2017

    • 著者名/発表者名
      齋藤 佑樹
    • 学会等名
      日本音響学会2017年春季研究発表会
    • 発表場所
      明治大学生田キャンパス(神奈川県)
    • 年月日
      2017-03-15
    • 関連する報告書
      2016 実績報告書
  • [学会発表] Training algorithm to deceive anti-spoofing verification for DNN-based speech synthesis2017

    • 著者名/発表者名
      Yuki Saito
    • 学会等名
      IEEE ICASSP
    • 発表場所
      New Orleans, USA
    • 年月日
      2017-03-05
    • 関連する報告書
      2016 実績報告書
    • 国際学会
  • [学会発表] DNNテキスト音声合成のための Anti-spoofing に敵対する学習アルゴリズム2017

    • 著者名/発表者名
      齋藤 佑樹
    • 学会等名
      情報処理学会
    • 発表場所
      琴平グランドホテル桜の抄(香川県)
    • 年月日
      2017-02-17
    • 関連する報告書
      2016 実績報告書
  • [学会発表] Modulation spectrum-based speech parameter trajectory smoothing for DNN-based speech synthesis using FFT spectra2017

    • 著者名/発表者名
      Shinnosuke Takamichi
    • 学会等名
      APSIPA ASC
    • 関連する報告書
      2017 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] Voice Conversion Using Sequence-to-Sequence Learning of Context Posterior Probabilities2017

    • 著者名/発表者名
      Hiroyuki Miyoshi, Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari
    • 学会等名
      INTERSPEECH
    • 関連する報告書
      2017 実績報告書
    • 国際学会
  • [学会発表] Sampling-based speech parameter generation using moment-matching network2017

    • 著者名/発表者名
      Shinnosuke Takamichi, Tomoki Koriyama, Hiroshi Saruwatari
    • 学会等名
      INTERSPEECH
    • 関連する報告書
      2017 実績報告書
    • 国際学会
  • [学会発表] 音素事後確率とd-vectorを用いたVariational Autoencoderによるノンパラレル多対多音声変換2017

    • 著者名/発表者名
      齋藤 佑樹, 井島 勇祐, 西田 京介, 高道 慎之介
    • 学会等名
      電子情報通信学会 音声研究会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] 雑音環境下音声を用いた音声合成のための雑音生成モデルの敵対的学習2017

    • 著者名/発表者名
      宇根 昌和, 齋藤 佑樹, 高道 慎之介, 北村 大地, 宮崎 亮一, 猿渡 洋
    • 学会等名
      情報処理学会 音声言語情報処理研究会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] コンテキスト事後確率のSequence-to-Sequence学習を用いた音声変換とDual Learningの評価2017

    • 著者名/発表者名
      三好 裕之, 齋藤 佑樹, 高道 慎之介, 猿渡 洋
    • 学会等名
      電子情報通信学会 音声研究会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] "Moment-matching networkに基づく音声合成における音声パラメータのランダム生成2017

    • 著者名/発表者名
      高道 慎之介, 郡山 知樹, 猿渡 洋
    • 学会等名
      情報処理学会 音楽情報科学研究会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] Moment-matching networkに基づく一期一会音声合成における発話間ゆらぎの評価2017

    • 著者名/発表者名
      高道 慎之介, 郡山 知樹, 齋藤 佑樹, 猿渡 洋
    • 学会等名
      日本音響学会2017年秋季研究発表会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] 敵対的DNN音声合成におけるダイバージェンスの影響の調査2017

    • 著者名/発表者名
      齋藤 佑樹, 高道 慎之介, 猿渡 洋
    • 学会等名
      日本音響学会2017年秋季研究発表会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] Anti-spoofingに敵対するDNN音声変換の評価2017

    • 著者名/発表者名
      齋藤 佑樹
    • 学会等名
      電子情報通信学会2017年春季研究発表会
    • 発表場所
      東京大学本郷キャンパス(東京都)
    • 関連する報告書
      2016 実績報告書
  • [学会発表] DNN 音声合成のための Anti-Spoofing を考慮した学習アルゴリズム2016

    • 著者名/発表者名
      齋藤 佑樹
    • 学会等名
      日本音響学会2016年秋季研究発表会
    • 発表場所
      明治大学生田キャンパス(神奈川県)
    • 年月日
      2016-09-14
    • 関連する報告書
      2016 実績報告書
  • [備考] Adversarial DNN-Based Text-To-Speech Synthesis

    • URL

      http://sython.org/demo/icassp2017advtts/demo.html

    • 関連する報告書
      2016 実績報告書
  • [備考] Adversarial DNN-Based Voice Conversion

    • URL

      http://sython.org/demo/sp201701advvc/demo.html

    • 関連する報告書
      2016 実績報告書

URL: 

公開日: 2016-09-02   更新日: 2019-03-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi