音声制約の自動獲得に基づく高品質音声合成に関する研究

研究課題

研究課題/領域番号	16H06681
研究種目	研究活動スタート支援
配分区分	補助金
研究分野	知能情報学
研究機関	東京大学
研究代表者	高道慎之介東京大学, 大学院情報理工学系研究科, 助教 (90784330)
研究期間 (年度)	2016-08-26 – 2018-03-31
研究課題ステータス	完了 (2017年度)
配分額 *注記	2,990千円 (直接経費: 2,300千円、間接経費: 690千円) 2017年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2016年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード	音声合成 / アンチ・スプーフィング / 深層学習 / 話者認証 / 音声なりすまし / anti-spoofing / 音声処理 / 音声変換 / 機械学習
研究成果の概要	音声合成技術は，人工的に音声を合成する技術である．合成音声の品質を改善するために，本研究では，敵対的学習を用いた統計的音声合成法を提案した．音質劣化の主要因は，音声パラメータの過剰な平滑化により生じたものである．提案法の学習基準は，通常の基準と敵対基準の重み付き和で得られる．敵対的学習は，自然・合成音声の分布間距離を最小化するため，過剰平滑化を効率的に緩和できる．実験的評価から，(1) 提案法はハイパーパラメータに対して頑健に働くこと，(2) Wasserstein 距離最小化に基づく提案法が，もっとも音質改善効果に有効であること，(3) ボコーダフリー音声合成に展開できることを示す．

報告書

(3件)

2017 実績報告書研究成果報告書 ( PDF )
2016 実績報告書

研究成果
(28件)

すべて 2018 2017 2016 その他

すべて雑誌論文 (3件) (うち査読あり 3件、オープンアクセス 3件) 学会発表 (23件) (うち国際学会 6件、招待講演 1件) 備考 (2件)

[雑誌論文] Statistical Parametric Speech Synthesis Incorporating Generative Adversarial Networks2018
- 著者名/発表者名
  Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processin
  
  巻: 26 号: 1 ページ: 84-96
- DOI
  10.1109/taslp.2017.2761547
- 関連する報告書
  2017 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Voice Conversion Using Input-to-Output Highway Networks2017
- 著者名/発表者名
  Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E100.D 号: 8 ページ: 1925-1928
- DOI
  10.1587/transinf.2017EDL8034
- NAID
  130005876129
- ISSN
  0916-8532, 1745-1361
- 関連する報告書
  2017 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Voice conversion using input-to-output highway networks2017
- 著者名/発表者名
  Yuki Saito, Shinnosuke Takamichi, and Hiroshi Saruwatari
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: Vol.E100-D
- NAID
  130005876129
- 関連する報告書
  2016 実績報告書
- 査読あり / オープンアクセス
[学会発表] Text-to-speech synthesis using STFT spectra based on low-/multi-resolution generative adversarial networks2018
- 著者名/発表者名
  Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari
- 学会等名
  IEEE ICASSP
- 関連する報告書
  2017 実績報告書
- 国際学会
[学会発表] Non-parallel voice conversion using variational autoencoders conditioned by phonetic posteriorgrams and d-vectors2018
- 著者名/発表者名
  Yuki Saito, Yusuke Ijima, Kyosuke Nishida, Shinnosuke Takamichi
- 学会等名
  IEEE ICASSP
- 関連する報告書
  2017 実績報告書
- 国際学会
[学会発表] 多重周波数解像度のSTFTスペクトルを用いた敵対的DNN音声合成2018
- 著者名/発表者名
  齋藤佑樹, 高道慎之介, 猿渡洋
- 学会等名
  日本音響学会2018年春季研究発表会
- 関連する報告書
  2017 実績報告書
[学会発表] 高品質声質変換のための特徴量分析再訪2018
- 著者名/発表者名
  須田仁志, 小谷岳, 高道慎之介, 齋藤大輔
- 学会等名
  日本音響学会2018年春季研究発表会
- 関連する報告書
  2017 実績報告書
[学会発表] 雑音環境下音声を用いたDNN音声合成のための雑音生成モデルの敵対的学習2018
- 著者名/発表者名
  宇根昌和, 齋藤佑樹, 高道慎之介, 北村大地, 宮崎亮一, 猿渡洋
- 学会等名
  日本音響学会2018年春季研究発表会
- 関連する報告書
  2017 実績報告書
[学会発表] GMMに基づく固有声変換のための変調スペクトル制約付きトラジェクトリ学習・適応2017
- 著者名/発表者名
  高道慎之介
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県）
- 年月日
  2017-03-15
- 関連する報告書
  2016 実績報告書
[学会発表] Moment matching networkを用いた音声パラメータのランダム生成の検討2017
- 著者名/発表者名
  高道慎之介
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県）
- 年月日
  2017-03-15
- 関連する報告書
  2016 実績報告書
[学会発表] コンテキスト事後確率のSequence-to-Sequence学習を用いた音声変換2017
- 著者名/発表者名
  三好裕之
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県）
- 年月日
  2017-03-15
- 関連する報告書
  2016 実績報告書
[学会発表] 敵対的DNN音声合成におけるF0・継続長の生成2017
- 著者名/発表者名
  齋藤佑樹
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県）
- 年月日
  2017-03-15
- 関連する報告書
  2016 実績報告書
[学会発表] Highway networkを用いた差分スペクトル法に基づく敵対的DNN音声変換2017
- 著者名/発表者名
  齋藤佑樹
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県）
- 年月日
  2017-03-15
- 関連する報告書
  2016 実績報告書
[学会発表] Training algorithm to deceive anti-spoofing verification for DNN-based speech synthesis2017
- 著者名/発表者名
  Yuki Saito
- 学会等名
  IEEE ICASSP
- 発表場所
  New Orleans, USA
- 年月日
  2017-03-05
- 関連する報告書
  2016 実績報告書
- 国際学会
[学会発表] DNNテキスト音声合成のための Anti-spoofing に敵対する学習アルゴリズム2017
- 著者名/発表者名
  齋藤佑樹
- 学会等名
  情報処理学会
- 発表場所
  琴平グランドホテル桜の抄（香川県）
- 年月日
  2017-02-17
- 関連する報告書
  2016 実績報告書
[学会発表] Modulation spectrum-based speech parameter trajectory smoothing for DNN-based speech synthesis using FFT spectra2017
- 著者名/発表者名
  Shinnosuke Takamichi
- 学会等名
  APSIPA ASC
- 関連する報告書
  2017 実績報告書
- 国際学会 / 招待講演
[学会発表] Voice Conversion Using Sequence-to-Sequence Learning of Context Posterior Probabilities2017
- 著者名/発表者名
  Hiroyuki Miyoshi, Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari
- 学会等名
  INTERSPEECH
- 関連する報告書
  2017 実績報告書
- 国際学会
[学会発表] Sampling-based speech parameter generation using moment-matching network2017
- 著者名/発表者名
  Shinnosuke Takamichi, Tomoki Koriyama, Hiroshi Saruwatari
- 学会等名
  INTERSPEECH
- 関連する報告書
  2017 実績報告書
- 国際学会
[学会発表] 音素事後確率とd-vectorを用いたVariational Autoencoderによるノンパラレル多対多音声変換2017
- 著者名/発表者名
  齋藤佑樹, 井島勇祐, 西田京介, 高道慎之介
- 学会等名
  電子情報通信学会音声研究会
- 関連する報告書
  2017 実績報告書
[学会発表] 雑音環境下音声を用いた音声合成のための雑音生成モデルの敵対的学習2017
- 著者名/発表者名
  宇根昌和, 齋藤佑樹, 高道慎之介, 北村大地, 宮崎亮一, 猿渡洋
- 学会等名
  情報処理学会音声言語情報処理研究会
- 関連する報告書
  2017 実績報告書
[学会発表] コンテキスト事後確率のSequence-to-Sequence学習を用いた音声変換とDual Learningの評価2017
- 著者名/発表者名
  三好裕之, 齋藤佑樹, 高道慎之介, 猿渡洋
- 学会等名
  電子情報通信学会音声研究会
- 関連する報告書
  2017 実績報告書
[学会発表] "Moment-matching networkに基づく音声合成における音声パラメータのランダム生成2017
- 著者名/発表者名
  高道慎之介, 郡山知樹, 猿渡洋
- 学会等名
  情報処理学会音楽情報科学研究会
- 関連する報告書
  2017 実績報告書
[学会発表] Moment-matching networkに基づく一期一会音声合成における発話間ゆらぎの評価2017
- 著者名/発表者名
  高道慎之介, 郡山知樹, 齋藤佑樹, 猿渡洋
- 学会等名
  日本音響学会2017年秋季研究発表会
- 関連する報告書
  2017 実績報告書
[学会発表] 敵対的DNN音声合成におけるダイバージェンスの影響の調査2017
- 著者名/発表者名
  齋藤佑樹, 高道慎之介, 猿渡洋
- 学会等名
  日本音響学会2017年秋季研究発表会
- 関連する報告書
  2017 実績報告書
[学会発表] Anti-spoofingに敵対するDNN音声変換の評価2017
- 著者名/発表者名
  齋藤佑樹
- 学会等名
  電子情報通信学会2017年春季研究発表会
- 発表場所
  東京大学本郷キャンパス（東京都）
- 関連する報告書
  2016 実績報告書
[学会発表] DNN 音声合成のための Anti-Spoofing を考慮した学習アルゴリズム2016
- 著者名/発表者名
  齋藤佑樹
- 学会等名
  日本音響学会2016年秋季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県）
- 年月日
  2016-09-14
- 関連する報告書
  2016 実績報告書
[備考] Adversarial DNN-Based Text-To-Speech Synthesis
- URL
  http://sython.org/demo/icassp2017advtts/demo.html
- 関連する報告書
  2016 実績報告書
[備考] Adversarial DNN-Based Voice Conversion
- URL
  http://sython.org/demo/sp201701advvc/demo.html
- 関連する報告書
  2016 実績報告書

音声制約の自動獲得に基づく高品質音声合成に関する研究

研究代表者

高道 慎之介 東京大学, 大学院情報理工学系研究科, 助教 (90784330)

2,990千円 (直接経費: 2,300千円、間接経費: 690千円)

報告書

研究成果

[雑誌論文] Statistical Parametric Speech Synthesis Incorporating Generative Adversarial Networks2018

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Voice Conversion Using Input-to-Output Highway Networks2017

著者名/発表者名

雑誌名

DOI

NAID

ISSN

関連する報告書

[雑誌論文] Voice conversion using input-to-output highway networks2017

著者名/発表者名

雑誌名

NAID

関連する報告書

[学会発表] Text-to-speech synthesis using STFT spectra based on low-/multi-resolution generative adversarial networks2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] Non-parallel voice conversion using variational autoencoders conditioned by phonetic posteriorgrams and d-vectors2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] 多重周波数解像度のSTFTスペクトルを用いた敵対的DNN音声合成2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] 高品質声質変換のための特徴量分析再訪2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] 雑音環境下音声を用いたDNN音声合成のための雑音生成モデルの敵対的学習2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] GMMに基づく固有声変換のための変調スペクトル制約付きトラジェクトリ学習・適応2017

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Moment matching networkを用いた音声パラメータのランダム生成の検討2017

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] コンテキスト事後確率のSequence-to-Sequence学習を用いた音声変換2017

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 敵対的DNN音声合成におけるF0・継続長の生成2017

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Highway networkを用いた差分スペクトル法に基づく敵対的DNN音声変換2017

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Training algorithm to deceive anti-spoofing verification for DNN-based speech synthesis2017

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] DNNテキスト音声合成のための Anti-spoofing に敵対する学習アルゴリズム2017

高道慎之介東京大学, 大学院情報理工学系研究科, 助教 (90784330)