研究概要 |
音声信号処理で広く利用されているスペクトル表現パラメータにメルケプストラムがある。メルケプストラムは,人間の聴覚特性を考慮した周波数数軸でのスペクトル表現パラメータであり,音声認識や音声合成・符号化における特徴パラメータとして有効性が実証されている.一方,時間的に変化する信号を扱うための手法としてウェーブレット変換が提案されており,非一様な時間・周波数分解能表現として応用が期待されている.本研究では,ケプストラムをウェーブレット変換することによって得られるパラメータであるウェーブレットケプストラムを定義し,メルケプストラムに代わる新たなスペクトル表現パラメータの可能性の検討を行っている. まず,ウェーブレット変換の基底関数としてハ-ル基底を用いたウェーブレットケプストラムを定義し,その性質を明らかにした.さらに,音声の対数スペクトルの不偏推定とウェーブレットケプストラムを用いたスペクトルモデルに基づくスペクトル推定法の定式化を行い,その解法を与えると同時に効率的な計算手法を与えた.また,実際の音声信号に適用することにより,ウェーブレットケプストラムの各帯域での次数を適切に選択することにより,メルケプストラムとほぼ等価な周波数分解能を持ったスペクトル表現が可能になること,メルケプストラム分析に対して約4割程度の処理時間でスペクトル分析を実行できること,得られたパラメータを音素認識システムに適用した場合,メルケプストラムと同等以上の認識性能が得られること等を明らかにした. 今後残りの研究期間において,ウェーブレットケプストラムをフィルタ係数とする音声合成フィルタの構成法の検討,音声合成とその評価,より詳細な音声認識実験等を行ない,随時得られた成果の発表を行う予定である.
|