ベイズ基準によるHMMに基づく音声合成における動的なパラメータ共有構造選択
Project/Area Number |
10J10062
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Research Field |
Perception information processing/Intelligent robotics
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
橋本 佳 名古屋工業大学, 大学院・工学研究科, 特別研究員(PD)
|
Project Period (FY) |
2010 – 2011
|
Project Status |
Completed (Fiscal Year 2011)
|
Budget Amount *help |
¥1,400,000 (Direct Cost: ¥1,400,000)
Fiscal Year 2011: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2010: ¥700,000 (Direct Cost: ¥700,000)
|
Keywords | 音声合成 / ベイズ基準 / パラメータ共有構造 / 事前分布 |
Research Abstract |
HMMに基づく音声合成において,パラメータ共有のための決定木構造の選択基準として様々な基準が提案されているが,これらの基準は一般に学習データに対する評価値が最も高くなる決定木構造を最適なパラメータ共有構造として選択する.このため,あらゆるテキストに対して平均的に高い品質の音声を合成することが可能となる.しかし,学習データに対する最適なパラメータ共有構造が合成するテキストにとって最適ではなく,生成するテキストごとに最適なパラメータ共有構造は異なると考えられる.そのため,合成テキストに対して最適なパラメータ共有構造をテキストごとに動的に選択し,高品質な音声合成手法を確立することを目指す.これまでの成果から,事前分布がパラメータ共有構造の選択に大きく影響を与えることが示されたため,適切な事前分布選択方法について検討を行った.複数の話者の学習データを用いることにより,他の話者の学習データを有効に利用することが可能になり,話者に非依存な音声の平均的な特徴を捉えた事前分布を推定することが可能になった.この事前分布を用いることによって,より適切なモデル構造を選択することが可能になり,合成音声の品質を大きく改善することを実験結果から示した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の主目的である,合成テキストに対して最適なパラメータ共有構造をテキストごとに動的に選択し,高品質な音声合成手法の有効性を示し,さらに適切な事前分布の推定方法を提案したことによって,さらなる合成音声の品質改善を実現した.
|
Strategy for Future Research Activity |
テキストごとに適切なパラメータ共有構造を選択することにより,合成音声の品質を大きく改善することを示したが,本手法は従来よりも多大な計算コストを必要となる.実環境においてストレスなく合成音声を生成するためにはパラメータ共有構造選択の高速化が必要であり,合成音声の品質を劣化させずに高速にパラメータ共有構造を選択するようなアルゴリズム,近似手法について今後検討していく必要がある.パラメータ共有構造の構築において,パラメータ共有構造全体をテキストごとに構築していくのではなく,テキストに非依存な構造をあらかじめ構築しておき,テキストに強く依存する部分の構造のみをテキストごとに構築することなどが近似手法として考えられる.
|
Report
(2 results)
Research Products
(17 results)