研究課題/領域番号 |
16H06681
|
研究種目 |
研究活動スタート支援
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
高道 慎之介 東京大学, 大学院情報理工学系研究科, 助教 (90784330)
|
研究期間 (年度) |
2016-08-26 – 2018-03-31
|
研究課題ステータス |
完了 (2017年度)
|
配分額 *注記 |
2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2017年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2016年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 音声合成 / アンチ・スプーフィング / 深層学習 / 話者認証 / 音声なりすまし / anti-spoofing / 音声処理 / 音声変換 / 機械学習 |
研究成果の概要 |
音声合成技術は,人工的に音声を合成する技術である.合成音声の品質を改善するために,本研究では,敵対的学習を用いた統計的音声合成法を提案した.音質劣化の主要因は,音声パラメータの過剰な平滑化により生じたものである.提案法の学習基準は,通常の基準と敵対基準の重み付き和で得られる.敵対的学習は,自然・合成音声の分布間距離を最小化するため,過剰平滑化を効率的に緩和できる.実験的評価から,(1) 提案法はハイパーパラメータに対して頑健に働くこと,(2) Wasserstein 距離最小化に基づく提案法が,もっとも音質改善効果に有効であること,(3) ボコーダフリー音声合成に展開できることを示す.
|