音声の生成過程を時変複素ARモデルとし、解析信号をターゲットとする、時変複素AR分析の提案を行っている。従来のARモデルを時変複素化するために、AR係数を任意の複素基底関数による展開で記述し、展開の係数を音声分析法で推定する。 既に、MMSE、M推定、補助変数(IV)法による分析アルゴリズムを提案した。今年度は、一般化最小2乗法(GLS>と拡大最小2乗法(ELS)に基づくロバストな時変複素AR音声分析法の構築を行い、さらに、前向き後向き予測によるGLS分析の構築も行った。GLS、ELSではMMSE式誤差をARモデルで記述し、式誤差にその逆フィルタ(白色化フィルタ)を掛けることで白色化を行う。式誤差は観測量ではないので時変複素ARフィルタと白色化フィルタの双方の係数を同時推定することはできないので、繰り返し推定によりアルゴリズムを実現する。なお、ELSはGLSの等価解である。白色雑音、ピンク雑音、工場雑音を付加した実音声を用いてスペクトル推定を行った結果、MMSEに比べて、GLSとELSは雑音の影響を受けない、平坦さの少ないスペクトルが推定できることを確認した。しかし、フレーム内での時変性が失われてしまい、フレーム間での推定スペクトルにギャップが生じるという問題が残った。そこで、GLSに前向き後向き予測に基づく分析アルゴリズムを提案した。前向き予測とは過去の信号を用いて現在の信号を予測する手法であり、後向き予測とは未来の信号を用いて現在の信号を予測する手法である。したがって、前向き後向き予測方式とは、前向き予測によるMSE(Mean of Squared Error)と後向き予測によるMSE(Mean of Squared Error)の和を最小化するようにパラメータを推定する方式である。MMSE法とGLSについて前向き後向き予測によるアルゴリズムを示し、雑音付加実音声を用いて実験を行った結果、前向き後向き予測GLSは前向き予測しか用いないGLSより滑らかなスペクトルを推定することが確認できた。
|