研究課題/領域番号 |
16K16096
|
研究機関 | 国立情報学研究所 |
研究代表者 |
高木 信二 国立情報学研究所, コンテンツ科学研究系, 特任助教 (50735090)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 音声合成 / ディープニューラルネットワーク / 信号処理 |
研究実績の概要 |
本研究では,従来のテキスト音声合成器に含まれるヒューリスティックに用いられていた処理や仮定を取り除き,最終的にDeep Neural Network (DNN)を用いた音声波形のダイレクトモデリング手法に基づく,テキスト音声合成器の実現を目的とする.研究計画は,課題1:ヒューリスティックなスペクトル包絡推定処理を取り除き,統計アプローチに基づく高精度なスペクトルのモデル化,課題2:スペクトルにおける位相情報のモデル化,課題3:DNNを用いた音声波形のダイレクトモデリング手法の確立に大きく分けられる.当該年度は課題(2)を中心に取り組んだ. 従来,音声から短時間フーリエ変換により得られた複素スペクトルは,その振幅値のみを用いることが多いが,課題(2)において,振幅スペクトル・位相スペクトルに分離することなく,位相情報を含む複素スペクトルの直接モデル化を検討した.複素スペクトルから実数特徴量の抽出を行うことが可能となる.本手法を用いた音声の分析/再合成実験を行い,ボコーダとの比較を行った.主観評価実験の結果から,提案手法による合成音声の品質の向上を示した.また,提案手法により複素スペクトルから抽出された特徴量を用いた,テキスト音声合成器の構築の検討を行った.また,異なるアプローチとして,位相スペクトルのモデル手法の検討を行った. また,課題(3)について,振幅スペクトル・位相スペクトルモデリングに基づく音声波形モデリングの理論整備を行った
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当該年度で計画していた位相情報を含めたスペクトルのモデリングに関する研究は順調に進展したため.
|
今後の研究の推進方策 |
今後は,課題(3)のDNNを用いた音声波形のダイレクトモデリング手法の確立を行い,テキスト音声合成器の構築を行うことを進める.
|