研究概要 |
ホルマント分析・合成システムの品質改善を目的とした新しい方式として、声帯音源微分波のパラメータを制御する方式を提案し、合成音声の評価を通して、パラメータの選択と品質の関係について検討した。 研究成果は、次のように要約される。 1.声帯音源微分波のパラメータ制御と無声子音区間における乱数の挿入により、殆んどすべての音声を不自然でなく合成出来ることが、予備的聴取テストの結果として理解された。 2.声帯音源微分波のパラメータは、声門体積流波形において意味のある時点(例えば、体積流の増加,減少における変化速度最大の時点や声門閉鎖の時点等)から選別されるが、音声波形に対する録音再生系の位相歪を補償した方が安定したパラメータを得るのに良い結果をもたらす。 3.声帯音源微分波の1ピッチ毎に、10次多項式近似を行って平滑化すると、その正ピーク,負ピーク(声道の励振点に相当)等の大きさと周期は、単語や文章の発話において、非常に連続的な変化を示し、パラメータの連続性が自然な音声の生成に重要な影響を与える要素であると推定される。 4.声帯音源微分波の各パラメータ間の相関々係は、励振点周期(ピッチ)と他のパラメータ,正ピークの大きさ(声門体積流の増加速度の最大値)と負ピークの大きさ(同減少速度の最大値)等に顕著である。前者の相関を利用して、回帰直線からパラメータ推定を行って合成した場合、情報伝送速度は750bits/s迄圧縮出来て、しかも、品質は全パラメータを用いた場合と殆んど変らないことが分った。 5.本方式における最も重要なパラメータ、励振点周期の推定は、零点と遮断周波数が同時に制御される逆フィルタと低域フィルタにより抽出された、声帯音源微分波から精度良く行える。
|