研究概要 |
本年度は、本研究で提案してきた語彙の印象属性に基づく対話韻律生成法の適応対象領域拡大の可能性を検証するため、言語を変えた合成音声の検討をさらに進めた。このため、世界的にも使用必要性が高く、日本語と韻律制御が対照的な英語対話音声合成を試みた。合成対象としては、確信(Of course, Certainly, Sure)、疑念(Shady, Why, Suspicious)、肯定(Agree, Okay, Bingo)、否定(No, Incorrect, Wrong)、好印象(Beautiful, Glad, Interesting)、悪印象(Dirty, Sad, Bored)といった日常会話で良く使用される単語表現を用いた。基本周波数の変更は、合成対象の英語単語に対応した印象を持つ日本一語発話「ん」が有する対話韻律特性を、読み上げ英語音声単語の韻律に付加した。この変更は、これまで同様に、指令応答モデルを使用し、各印象に応じて時間長も変更して、対話韻律を実現した。出来上がった合成音声の自然性により、提案する対話韻律制御の妥当性を検証した。比較対象として、読み上げ音声の他に、入力印象属性と一致しない対話韻律を付加したものを加えた自然性判定受聴試験を行った。受聴実験の結果、印象属性と一致した対話韻律を付与した音声は、元の読み上げ韻律を持つ音声より自然性が高く、入力印象属性と一致しない対話韻律を付与した音声の自然性は読み上げ韻律を持つ音声より低いことが判明した。これにより、提案方法の有効性が英語音声でも確認でき、先に行った中国語への適用予備実験結果とあわせることにより、言語によらない対話韻律制御方法としての発展可能性を示すことができた。
|