研究課題
ガウス過程回帰によるノンパラメトリックモデル化に基づくテキスト音声合成手法の開拓をめざして、研究初年度では、ガウス過程回帰モデルに基づいたスペクトルパラメータ系列の生成手法を提案し、従来の隠れマルコフモデルに基づくモデル化に比べて性能が改善することを示した。本年度は提案手法のさらなる性能向上に重点をおいて研究を実施した。まず、従来の統計的パラメトリック音声合成手法において,生成パラメータの過剰平滑化の抑制に有用性が知られている系列内変動を提案モデル化手法に導入した定式化を行った。これに加えて動的特徴量を考慮したパラメータ生成の定式化も行った。その結果、系列内変動と動的特徴量を導入することで、合成音声のスペクトル歪をさらに減少できることを示した。さらに、これら提案手法で用いる最適なハイパーパラメータの推定手法を提案し、ハイパーパラメータの調整が自動化できることを示した。次に、ガウス過程回帰を用いる統一的な枠組みによる音声合成システムの構築をめざし、音声のスペクトルに加えて韻律のモデル化・パラメータ生成手法の開発にも着手した。ガウス過程分類を利用した有声/無声区間推定、ガウス過程回帰に基づく基本周波数パタンのモデル化とパラメータ生成手法、韻律生成時に有用となるフレームコンテキスト等の基礎的検討を行い、提案音声合成システムを実現できる見通しが得られた。この他に,新たな音声合成手法の枠組みの開発と同時に、読上げ調音声と比べて合成音声の再現がより難しいオーディオブック向け音声と歌唱音声の収録を行い、提案手法の性能評価を行うための基盤整備を行った。本研究で得られた成果を基に、今後はガウス過程回帰を用いる統一的な枠組みによる音声合成システムを実現し、多様な話者性や話し言葉を含む多様なスタイルによる音声合成、多言語音声合成へと,研究を展開して行く予定である。
すべて 2015 2014
すべて 雑誌論文 (7件) (うち査読あり 4件、 謝辞記載あり 7件) 学会発表 (6件)
日本音響学会2015年春季研究発表会講演論文集
巻: CD-ROM ページ: 269-270
巻: CD-ROM ページ: 371-372
Proceedings of 2015 IEEE International Conference on Acoustics, Speech, and Signal Processing
巻: ICASSP 2015 ページ: 4929-4933
IEEE Journal of Selected Topics in Signal Processing
巻: 8 ページ: 173-183
10.1109/JSTSP.2013.2283461
Proceedings of 2014 IEEE International Conference on Acoustics, Speech, and Signal Processing
巻: ICASSP 2014 ページ: 3862-3866
10.1109/ICASSP.2014.6854319
Proceedings of IEEE International Workshop on Machine Learning for Signal Processing
巻: MLSP 2014 ページ: 1-6
10.1109/MLSP.2014.6958921
日本音響学会2014年秋季研究発表会講演論文集
巻: CD-ROM ページ: 247-248