本年度の研究において、以下の点を明らかにした。 1. 線スペクトル対の適応推定において、追従性が劣化する原因を明らかにした。実音声を対象にした実験を行い、拡張カルマンフィルタで線スペクトル対を推定した場合と、従来の線形予測係数を推定した場合を比較した。その結果、線スペクトル対の推定では、カルマンゲインの計算に必要なパラメータの推定誤差共分散行列の収束が遅いことが判明した。線形予測係数の推定では、推定誤差共分散行列が観測信号のみから計算されるのに対して、線スペクトル対の推定では、観測信号とパラメータ(線スペクトル対)の値が必要となる。しかし、真の値は未知であるため、かわりに現時刻での推定値を用いている。そのため、非定常区間では推定値と真値の差が大きく、近似が不十分になり、追従性の劣化の原因となっていた。 2. 追従性を改善するために、推定アルゴリズムにパラメータの誤差分散、すなわち、パラメータの変動の大きさを予測する機能を組み入れた。フィルタバンクを用いて残差信号を帯域分割し、各帯域毎の残差信号のパワーを求め、残差全体のパワーに対する各帯域の残差パワーの変動によって各線スペクトル対の変動の大きさを予測した。これは、線スペクトル対が周波数領域のパラメータであり、その推定誤差の大きさは、その近傍の周波数帯域の残差信号のパワーで評価できると考えたからである。合成信号および実音声を対象にした実験では、予測機能を組み込むことにより、非定常区間での追従性を改善でき、かつ、定常区間での推定値のバラツキを抑えることができることを明らかにした。
|