研究概要 |
本研究で実現を目指す「固有声に基づいた音声合成システム」は,大きくわけて(1)固有声学習部},(2)声質設定部},(3)音声合成部の3つの部分からなる.「音声合成部」については,これまでに提案した「HMMに基づく音声合成」により実現できるが,「固有声学習部」,「声質設定部」に関しては,以下にあげるいくつかの問題点を解決しなければならない. 本年度は主として音声合成における固有声手法の確立を目指し、以下を行った. 1.固有声算出のため、特定話者HMMの学習:40名分の特定話者モデルを学習した. 2.合成音声の基本品質を向上させるため、コンテキスト依存HMM(トライフォンHMM)の導入を行った.但し、特別な工夫なくコンテキスト依存HMMを導入しただけでは、各特定話者モデルの構造が異なったものとなり、固有声手法を適用することができなくなるため、この問題を解決するための、特定話者モデルのクラスタリング手法を提案した. 3.提案した手法により得られた固有声に基づいて音声を合成し,期待通りの動作をするか,また,基本的な音声品質に劣化がないかなどについて確認した. 4.受聴試験により、コンテキスト依存HMMを用いることにより、合成音声の品質が大幅に向上することを確認した. 5.因子分析に基づいて、各固有声成分がどのような声質の表現語に対応しているかについて、基礎的な検討を行った.
|