2001 Fiscal Year Annual Research Report
時変複素AR(TV-CAR)音声分析法の高度化と音声符号化・音声認識処理への適用
Project/Area Number |
12750344
|
Research Institution | University of the Ryukyus |
Principal Investigator |
舟木 慶一 琉球大学, 総合情報処理センター, 講師 (30315486)
|
Keywords | 音声分析法 / 複素信号処理 / 時変モデル / 補助変数法 / ロバスト推定 / GLS / ELS |
Research Abstract |
音声の生成過程を時変複素ARモデルとし、解析信号をターゲットとする、時変複素AR分析の提案を行っている。従来のARモデルを時変複素化するために、AR係数を任意の複素基底関数による展開で記述し、展開の係数を音声分析法で推定する。 既に、MMSE、M推定、補助変数(IV)法による分析アルゴリズムを提案した。今年度は、一般化最小2乗法(GLS>と拡大最小2乗法(ELS)に基づくロバストな時変複素AR音声分析法の構築を行い、さらに、前向き後向き予測によるGLS分析の構築も行った。GLS、ELSではMMSE式誤差をARモデルで記述し、式誤差にその逆フィルタ(白色化フィルタ)を掛けることで白色化を行う。式誤差は観測量ではないので時変複素ARフィルタと白色化フィルタの双方の係数を同時推定することはできないので、繰り返し推定によりアルゴリズムを実現する。なお、ELSはGLSの等価解である。白色雑音、ピンク雑音、工場雑音を付加した実音声を用いてスペクトル推定を行った結果、MMSEに比べて、GLSとELSは雑音の影響を受けない、平坦さの少ないスペクトルが推定できることを確認した。しかし、フレーム内での時変性が失われてしまい、フレーム間での推定スペクトルにギャップが生じるという問題が残った。そこで、GLSに前向き後向き予測に基づく分析アルゴリズムを提案した。前向き予測とは過去の信号を用いて現在の信号を予測する手法であり、後向き予測とは未来の信号を用いて現在の信号を予測する手法である。したがって、前向き後向き予測方式とは、前向き予測によるMSE(Mean of Squared Error)と後向き予測によるMSE(Mean of Squared Error)の和を最小化するようにパラメータを推定する方式である。MMSE法とGLSについて前向き後向き予測によるアルゴリズムを示し、雑音付加実音声を用いて実験を行った結果、前向き後向き予測GLSは前向き予測しか用いないGLSより滑らかなスペクトルを推定することが確認できた。
|
Research Products
(5 results)
-
[Publications] 舟木慶一, 長浜貴乃: "前向き後向き予測による時変複素音声分析"日本音響学会2002年春季研究発表会講演論文集. I. 359-360 (2002)
-
[Publications] 舟木慶一, 長浜貴乃: "ELSに基づく時変複素音声分析"第16回DSPシンポジウム講演論文集. (2002)
-
[Publications] 舟木慶一, 長浜貴乃: "一般化最小2乗法に基づくロバスト時変複素音声分析"日本音響学会2001年春季研究発表会講演論文集. I. (2001)
-
[Publications] Keiichi Funaki: "A time-varying complex ARMA speech modeling based on IV method"Proc.of MAVEBA 2001. (2001)
-
[Publications] Keiichi Funaki: "A time-varying complex AR speech analysis based on GLS and ELS"Proc.of Eurospeech 2001. (2001)