研究概要 |
HMMに基づく音声合成において,パラメータ共有のための決定木構造の選択基準として様々な基準が提案されているが,これらの基準は一般に学習データに対する評価値が最も高くなる決定木構造を最適なパラメータ共有構造として選択する.このため,あらゆるテキストに対して平均的に高い品質の音声を合成することが可能となる.しかし,学習データに対する最適なパラメータ共有構造が合成するテキストにとって最適ではなく,生成するテキストごとに最適なパラメータ共有構造は異なると考えられる.そのため,合成テキストに対して最適なパラメータ共有構造をテキストごとに動的に選択し,高品質な音声合成手法を確立することを目指す.合成テキストごとに最適なパラメータ共有構造を選択するために,まず,パラメータ共有構造と合成音声の品質に関する分析,そして,合成テキストに対する最適な評価関数の検討を行った.そして,これらの結果をもとに,合成テキストごとにパラメータ共有構造の選択を行った.提案法は従来法から合成音声の品質を大きく改善したが,事前分布の設定が大きく影響を与えることがわかった.そのため,今後は適切な事前分布の設定法に関する検討が必要である.また,テキストごとにパラメータ共有構造を選択するため,従来よりも多大な計算コストを必要とする.実環境においてストレスなく音声合成システムが動作するような,パラメータ共有構造の高速選択も課題となる.
|