人間のコミュニケーションにおいて、音声を用いることが最も身近なことである。一方、中国の開放によって、より多くの人が中国語に触れる機会が多くなってくる。中国語の高品質な音声合成システムを求める声が高い。しかし、現在そのようなシステムは研究段階であり、本研究はそのニーズを答えて検討するものである。 本研究はデータベースの小型化、音質の改善、音韻連鎖の音韻学などの面からの解明について検討している。 前年度は音韻連鎖の検討として、標準中国語男性話者一人の音声データを録音し、母音から母音の遷移パタンについて検討した。 今年度はまずそれを更に効率よく近似するためのアルゴリズムを検討し、ピッチの制御などを含んだ処理を行い、遷移パタンの近似精度を上げることにした。更にフレーズなど少し長い単位での韻律パタンを制御するアルゴリズムを提案し、音声合成の品質の改善を行いました。 また、録音データには多くの会話文が含まれているので、その特徴を音韻と韻律の両方に渡って分析し、その特徴を示すことにもしました。 更に、高品質音声分析・変換・合成システムSTRAIGHTを利用してノンパラメートリクな合成方法についての精度を検討している。この音声モーフィングアルゴリズムで接続された音声(音韻連鎖音声)の品質を客観的(今回はスペクトル歪CDと時間伸縮度合を用いた)、主観的(自然性の聴覚実験)評価を行っている。
|