2014 Fiscal Year Annual Research Report
多様で肉声感の高い音声生成のための素片正規化に基づくハイブリッド音声合成の研究
Project/Area Number |
25730106
|
Research Institution | Tohoku University |
Principal Investigator |
能勢 隆 東北大学, 工学(系)研究科(研究院), 講師 (90550591)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Keywords | 統計的音声合成 / 隠れマルコフモデル / パラメータ生成 / ガウス過程回帰 / 重回帰隠れセミマルコフモデル / 強調表現 / 歌声合成 |
Outline of Annual Research Achievements |
本研究では多様で肉声感の高い音声の合成を実現するため,従来の隠れマルコフモデル(HMM)に基づく統計的音声合成の品質改善について検討を行った.具体的には主として以下の様な研究成果が得られた.(1)音声パラメータの生成において従来の尤度の制約だけでなく分散の局所的制約を用いたハイブリッドなパラメータ生成法による音声の自然性の改善(2)強調コンテキストの自動付与に基づく韻律の多様化(3)ガウス過程回帰に基づくパラメータ生成法によるスペクトル再現性の改善(4)重回帰隠れセミマルコフモデル(MRHSMM)に基づいた歌唱スタイルの直観的制御の実現.(1)では従来のHMM音声合成において問題になっていたスペクトル包絡のピークの平坦化による自然性低下を音韻や韻律に依存したコンテキストに基づく局所的な分散の制約を導入することで抑制することで,聴覚的な自然性の改善を主観評価により示した.(2)では従来困難であった音声における強調表現の自動付与を,強調ラベルを考慮せず生成された基本周波数(F0)系列と原音声のF0系列の差分を利用することで実現し,従来に比べて表現豊かな韻律が得られれることを実験により示した.(3)では従来の決定木に基づく未知パラメータの予測に替わりガウス過程回帰を用いることでより正確なスペクトルパラメータを予測することができ,主観的品質の向上を実現した.(4)では歌声合成において複数の歌唱スタイルをMRHSMMによりモデル化することで,従来単調であった歌唱スタイルをその種類に加え度合いについても制御できることを示した.
|
Research Products
(10 results)