2016 年度実績報告書

音声制約の自動獲得に基づく高品質音声合成に関する研究

研究課題

研究課題/領域番号	16H06681
研究機関	東京大学
研究代表者	高道慎之介東京大学, 大学院情報理工学系研究科, 特任助教 (90784330)
研究期間 (年度)	2016-08-26 – 2018-03-31
キーワード	音声合成 / 音声処理 / 深層学習
研究実績の概要	本年度は，①基盤アルゴリズムの構築，②発話間変動を考慮した音声合成法の検討に取り組んだ． ① 基盤アルゴリズムの構築基本的な学習アルゴリズムを確立し，提案アルゴリズムによる品質改善効果を確認した．音声合成の学習時の目的関数は，ターゲット音声との距離とアンチ・スプーフィングの識別性能の2つから成る．まず，この目的関数の設計（モデル構造や制約重みなど）及び学習手順（学習速度や初期化）について，当該特徴量の補償度及び主観的な音質評価により評価した．当該分野は，当該分野最高峰の国際会議であるIEEE ICASSPにて，論文1編のみに与えられるStudent Grantを獲得した．また，最高峰の学術論文に1編投稿中である． ② 発話間変動を考慮した音声合成法の検討人間の音声生成はランダム性を有するため，同一のテキスト・感情を持つよう意図して発話したとしても，同一の音声を生成することは不可能である．典型的な音声合成は，入力テキストに対して合成音声を一意に定めるため，自然音声のようなランダム性を有さない（例えば，テキスト読み上げサービスは多々存在するが，同じテキストを入力すると完全に同一の音声を生成する．）．ここでは，このランダム性を再現するように，moment-matching neural networkに基づく音声合成法を提案し，音質に関する評価を行った．その結果，従来の方法と比較して音質を劣化させるように，発話間変動を付与できるようになった．
現在までの達成度 (区分)	現在までの達成度 (区分) 1: 当初の計画以上に進展している理由当初は，概要①のみの進捗を予定していたが，概要②の成果も報告できたため．
今後の研究の推進方策	平成29年度は，音声波形ドメインにおける制約の設計，及び，特徴量分析区間の自動獲得を実施する．音声合成の学習には，前年度に確立したアルゴリズムを利用する．

研究成果
(12件)

すべて 2017 2016 その他

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件) 学会発表 (9件) (うち国際学会 1件) 備考 (2件)

[雑誌論文] Voice conversion using input-to-output highway networks2017
- 著者名/発表者名
  Yuki Saito, Shinnosuke Takamichi, and Hiroshi Saruwatari
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: Vol.E100-D ページ: -
- 査読あり / オープンアクセス
[学会発表] GMMに基づく固有声変換のための変調スペクトル制約付きトラジェクトリ学習・適応2017
- 著者名/発表者名
  高道慎之介
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県）
- 年月日
  2017-03-15 – 2017-03-17
[学会発表] Moment matching networkを用いた音声パラメータのランダム生成の検討2017
- 著者名/発表者名
  高道慎之介
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県）
- 年月日
  2017-03-15 – 2017-03-17
[学会発表] コンテキスト事後確率のSequence-to-Sequence学習を用いた音声変換2017
- 著者名/発表者名
  三好裕之
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県）
- 年月日
  2017-03-15 – 2017-03-17
[学会発表] 敵対的DNN音声合成におけるF0・継続長の生成2017
- 著者名/発表者名
  齋藤佑樹
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県）
- 年月日
  2017-03-15 – 2017-03-17
[学会発表] Highway networkを用いた差分スペクトル法に基づく敵対的DNN音声変換2017
- 著者名/発表者名
  齋藤佑樹
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県）
- 年月日
  2017-03-15 – 2017-03-17
[学会発表] Training algorithm to deceive anti-spoofing verification for DNN-based speech synthesis2017
- 著者名/発表者名
  Yuki Saito
- 学会等名
  IEEE ICASSP
- 発表場所
  New Orleans, USA
- 年月日
  2017-03-05 – 2017-03-09
- 国際学会
[学会発表] DNNテキスト音声合成のための Anti-spoofing に敵対する学習アルゴリズム2017
- 著者名/発表者名
  齋藤佑樹
- 学会等名
  情報処理学会
- 発表場所
  琴平グランドホテル桜の抄（香川県）
- 年月日
  2017-02-17 – 2017-02-18
[学会発表] Anti-spoofingに敵対するDNN音声変換の評価2017
- 著者名/発表者名
  齋藤佑樹
- 学会等名
  電子情報通信学会2017年春季研究発表会
- 発表場所
  東京大学本郷キャンパス（東京都）
- 年月日
  2017-01-20 – 2017-01-20
[学会発表] DNN 音声合成のための Anti-Spoofing を考慮した学習アルゴリズム2016
- 著者名/発表者名
  齋藤佑樹
- 学会等名
  日本音響学会2016年秋季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県）
- 年月日
  2016-09-14 – 2016-09-16
[備考] Adversarial DNN-Based Text-To-Speech Synthesis
- URL
  http://sython.org/demo/icassp2017advtts/demo.html
[備考] Adversarial DNN-Based Voice Conversion
- URL
  http://sython.org/demo/sp201701advvc/demo.html

2016 年度 実績報告書

音声制約の自動獲得に基づく高品質音声合成に関する研究

研究代表者

高道 慎之介 東京大学, 大学院情報理工学系研究科, 特任助教 (90784330)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Voice conversion using input-to-output highway networks2017

著者名/発表者名

雑誌名

[学会発表] GMMに基づく固有声変換のための変調スペクトル制約付きトラジェクトリ学習・適応2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Moment matching networkを用いた音声パラメータのランダム生成の検討2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] コンテキスト事後確率のSequence-to-Sequence学習を用いた音声変換2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 敵対的DNN音声合成におけるF0・継続長の生成2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Highway networkを用いた差分スペクトル法に基づく敵対的DNN音声変換2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Training algorithm to deceive anti-spoofing verification for DNN-based speech synthesis2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] DNNテキスト音声合成のための Anti-spoofing に敵対する学習アルゴリズム2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Anti-spoofingに敵対するDNN音声変換の評価2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] DNN 音声合成のための Anti-Spoofing を考慮した学習アルゴリズム2016

著者名/発表者名

学会等名

発表場所

年月日

[備考] Adversarial DNN-Based Text-To-Speech Synthesis

URL

[備考] Adversarial DNN-Based Voice Conversion

URL

2016 年度実績報告書

高道慎之介東京大学, 大学院情報理工学系研究科, 特任助教 (90784330)