研究課題
本研究では多様で肉声感の高い音声の合成を実現するため,従来の隠れマルコフモデル(HMM)に基づく統計的音声合成の品質改善について検討を行った.具体的には主として以下の様な研究成果が得られた.(1)音声パラメータの生成において従来の尤度の制約だけでなく分散の局所的制約を用いたハイブリッドなパラメータ生成法による音声の自然性の改善(2)強調コンテキストの自動付与に基づく韻律の多様化(3)ガウス過程回帰に基づくパラメータ生成法によるスペクトル再現性の改善(4)重回帰隠れセミマルコフモデル(MRHSMM)に基づいた歌唱スタイルの直観的制御の実現.(1)では従来のHMM音声合成において問題になっていたスペクトル包絡のピークの平坦化による自然性低下を音韻や韻律に依存したコンテキストに基づく局所的な分散の制約を導入することで抑制することで,聴覚的な自然性の改善を主観評価により示した.(2)では従来困難であった音声における強調表現の自動付与を,強調ラベルを考慮せず生成された基本周波数(F0)系列と原音声のF0系列の差分を利用することで実現し,従来に比べて表現豊かな韻律が得られれることを実験により示した.(3)では従来の決定木に基づく未知パラメータの予測に替わりガウス過程回帰を用いることでより正確なスペクトルパラメータを予測することができ,主観的品質の向上を実現した.(4)では歌声合成において複数の歌唱スタイルをMRHSMMによりモデル化することで,従来単調であった歌唱スタイルをその種類に加え度合いについても制御できることを示した.
すべて 2014
すべて 雑誌論文 (8件) (うち査読あり 5件、 謝辞記載あり 8件) 学会発表 (2件)
Speech Communication
巻: 57 ページ: 144-154
10.1016/j.specom.2013.09.014
IEEE Journal of Selected Topics in Signal Processing
巻: 8 ページ: 221-228
10.1109/JSTSP.2013.2283459
巻: 8 ページ: 173-183
10.1109/JSTSP.2013.2283461
日本音響学会2014年春季研究発表会講演論文集
巻: 1 ページ: 355-356
電子情報通信学会技術研究報告
巻: 113 ページ: 19-24
Proceedings of 2014 IEEE International Conference on Acoustics, Speech, and Signal Processing
巻: 1 ページ: 3862-3866
日本音響学会2014年秋季研究発表会講演論文集
巻: 1 ページ: 247-248
Proceedings of 24th IEEE International Workshop on Machine Learning for Signal Processing
巻: 1 ページ: 1-6