本研究は,任意の話者の限られた音声データのみで「人間に近い肉声感」をもち,かつ様々な感情や発話様式を表現可能なハイブリッド型の音声合成方式を確立することを目的として研究を行い,以下の6つの項目について成果が得られた.(1)非言語情報やパラ言語情報を柔軟に再現・制御可能とする,(2)韻律の多様性を自動学習する,(3)多言語の音声合成への拡張を行う,(4)音声だけでなく歌声への応用についても検討する,(5)このような音声コーパスを効率的に構築する方法を確立する,(6)従来のパラメータ生成法を改善し主観品質を向上する,
|