Wavelet理論は80年代末より提唱された数学理論で、一種のフーリエ変換に類似する。音声波形への適用は90年代になってからで、音声波形にWavelet変換を適用すると、最終的には元の波形の特徴、特にそのpitch成分を保持したSinusoid波形に変換され、ためにpitchの抽出が可能になることが報告されている。昨年は、正常音声波形はWavelet変換を7回から9回施行すればほぼSinusoid波形に変換され、Pitch抽出はきわめて容易となること、声帯麻痺の気息性嗄声では、9回変換してもSinusoidにはならないものが散見されることを報告したので、今回は雑音成分がどの程度になればSinusoidになっていくかを検討した。 正常声帯30人と一側声帯麻痺30人の音声約187msec分を16ビット、サンプリング周波数44.1kHzでマッキントッシュコンピュータにとりこんだ。この音声データに自らプログラミングしたWavelet変換(Lemarie_- BattleのWaveletを使用)を行なった。一方、音声データはRION77で規格化雑音エネルギーNNEaを計算させて、その値との対比を行った。 その結果、NNEaが全体として-10dBより悪化するとSinusoidにならない場合が多いと言えることがわかった。これはWaveletをほかのものに変えても同じであり、かつその次元を増やしても余り変化は認められなかった。今後は同時に計算できる基本周波数変動率PPQや振幅変動率APQとの対比を行っていく予定であり、現在PPQ、APQのプログラミングは終了しつつある。
|