1.時変ARX分析法の性能について詳細に検討した。その結果、これまで常識となっていた声門閉鎖区間での声道パラメータ推定精度は必ずしも良いとは言えず、むしろ開放区間で安定な極が推定できること、閉鎖点付近では不安定な極が推定されることがあること、などがわかった。 2.ソース・フォルマントテンプレートの作成法について検討し、第1〜3フォルマント周波数の時間変動関数(分散関数)に基づいてCV(子音母音連続からまるモ-ラ)テンプレートを組織的に作成できることを確認した。 3.音源振幅と基本周波数を制御するための韻律制御規則について検討し、ソースパラメータテンプレートとアクセント句・韻律句情報などから決定される振幅・基本周波数の自動生成規則を作成した。 4.今年度は、目標とする国際音声学会議が制定した声質のうち、「ささやき声(whisper)」に焦点を当て、その音響的性質を検討した。その結果、低次のフォルマント周波数が若干高くなる(平均的に1.2倍)こと、音源スペクトル形状は高域成分を落とした方がよいこと、喉頭雑音源振幅の制御は、有声音のそれの定数倍でよいこと、などが明らかになった。実際に、通常発声(modal voice)を合成するパラメータに上述の変換規則を適用して合成した結果、自然なささやき音声が得られることを知覚実験によって確認した。
|