Wavelet理論は80年代末より提唱された数学理論で、一種のフーリエ変換に類似する。音声波形への適用は90年代になってからで、音声波形にWavelet変換を適用すると、最終的には元の波形の特徴、特にそのpitch成分を保持したSinusoid波形に変換され、ためにpitchの抽出が可能になることが報告されている。今回は雑音成分を多く含んだ嗄声からpitchを正確にとらえることができるか否か知ることを目的にして以下の検討を行った。正常声帯30人と一側声帯麻痺30人の音声約187msec分を16ビット、サンプリング周波数44.1kHzでマッキントッシュコンピュータにとりこんだ。この音声データに自らプログラミングしたWavelet変換(Lemarie-BattleのWaveletを使用)を行なった。その結果、正常音声波形はWavelet変換を7回から9回施行すればほぼSinusoid波形に変換され、Pitch抽出はきわめて容易となることがわかった。ところが声帯麻痺の気息性嗄声では、9回変換してもSinusoidにはならないものが散見された。特にそれは聴覚印象的に気息性が強くなればなるほど多く、聴覚印象との強い相関を示すことがわかった。因子分析的手法を用いてこの関連性を検討して、数個以下のパラメータを抽出しようと現在模索しているところで、因子分析のプログラミングも同時に行いつつある。一方でWaveletで変換した各波形について基本周波数変動率や振幅変動率、規格化雑音エネルギーを計算して、その変化の程度を検討していく。
|