時変複素AR(TV-CAR)音声分析法の高度化と音声符号化・音声認識処理への適用

Research Project

Project/Area Number	12750344
Research Category	Grant-in-Aid for Encouragement of Young Scientists (A)
Allocation Type	Single-year Grants
Research Field	情報通信工学
Research Institution	University of the Ryukyus
Principal Investigator	舟木慶一琉球大学, 総合情報処理センター, 講師 (30315486)
Project Period (FY)	2000 – 2001
Project Status	Completed (Fiscal Year 2001)
Budget Amount *help	¥2,200,000 (Direct Cost: ¥2,200,000) Fiscal Year 2001: ¥1,000,000 (Direct Cost: ¥1,000,000) Fiscal Year 2000: ¥1,200,000 (Direct Cost: ¥1,200,000)
Keywords	音声分析法 / 複素信号処理 / 時変モデル / 補助変数法 / ロバスト推定 / GLS / ELS
Research Abstract	音声の生成過程を時変複素ARモデルとし、解析信号をターゲットとする、時変複素AR分析の提案を行っている。従来のARモデルを時変複素化するために、AR係数を任意の複素基底関数による展開で記述し、展開の係数を音声分析法で推定する。既に、MMSE、M推定、補助変数(IV)法による分析アルゴリズムを提案した。今年度は、一般化最小2乗法(GLS>と拡大最小2乗法(ELS)に基づくロバストな時変複素AR音声分析法の構築を行い、さらに、前向き後向き予測によるGLS分析の構築も行った。GLS、ELSではMMSE式誤差をARモデルで記述し、式誤差にその逆フィルタ(白色化フィルタ)を掛けることで白色化を行う。式誤差は観測量ではないので時変複素ARフィルタと白色化フィルタの双方の係数を同時推定することはできないので、繰り返し推定によりアルゴリズムを実現する。なお、ELSはGLSの等価解である。白色雑音、ピンク雑音、工場雑音を付加した実音声を用いてスペクトル推定を行った結果、MMSEに比べて、GLSとELSは雑音の影響を受けない、平坦さの少ないスペクトルが推定できることを確認した。しかし、フレーム内での時変性が失われてしまい、フレーム間での推定スペクトルにギャップが生じるという問題が残った。そこで、GLSに前向き後向き予測に基づく分析アルゴリズムを提案した。前向き予測とは過去の信号を用いて現在の信号を予測する手法であり、後向き予測とは未来の信号を用いて現在の信号を予測する手法である。したがって、前向き後向き予測方式とは、前向き予測によるMSE(Mean of Squared Error)と後向き予測によるMSE(Mean of Squared Error)の和を最小化するようにパラメータを推定する方式である。MMSE法とGLSについて前向き後向き予測によるアルゴリズムを示し、雑音付加実音声を用いて実験を行った結果、前向き後向き予測GLSは前向き予測しか用いないGLSより滑らかなスペクトルを推定することが確認できた。

Report

(2 results)

2001 Annual Research Report
2000 Annual Research Report

Research Products
(8 results)

All Other

All Publications (8 results)

[Publications] 舟木慶一, 長浜貴乃: "前向き後向き予測による時変複素音声分析"日本音響学会2002年春季研究発表会講演論文集. I. 359-360 (2002)
- Related Report
  2001 Annual Research Report
[Publications] 舟木慶一, 長浜貴乃: "ELSに基づく時変複素音声分析"第16回DSPシンポジウム講演論文集. (2002)
- Related Report
  2001 Annual Research Report
[Publications] 舟木慶一, 長浜貴乃: "一般化最小2乗法に基づくロバスト時変複素音声分析"日本音響学会2001年春季研究発表会講演論文集. I. (2001)
- Related Report
  2001 Annual Research Report
[Publications] Keiichi Funaki: "A time-varying complex ARMA speech modeling based on IV method"Proc.of MAVEBA 2001. (2001)
- Related Report
  2001 Annual Research Report
[Publications] Keiichi Funaki: "A time-varying complex AR speech analysis based on GLS and ELS"Proc.of Eurospeech 2001. (2001)
- Related Report
  2001 Annual Research Report
[Publications] 舟木慶一: "補助変数(IV)法を用いた時変複素AR分析"日本音響学会2000年秋季研究発表会講演論文集. I. 269-270 (2000)
- Related Report
  2000 Annual Research Report
[Publications] 舟木慶一: "補助変数法に基づくロバスト時変複素音声分析"第15回ディジタル信号処理シンポジウム講演論文集. 427-432 (2000)
- Related Report
  2000 Annual Research Report
[Publications] Keiichi Funaki: "A time-varying complex speech analysis based on IV"Proc.of ICSLP-2000. IV. 688-691 (2000)
- Related Report
  2000 Annual Research Report

時変複素AR(TV-CAR)音声分析法の高度化と音声符号化・音声認識処理への適用

Principal Investigator

舟木 慶一 琉球大学, 総合情報処理センター, 講師 (30315486)

¥2,200,000 (Direct Cost: ¥2,200,000)

Report

Research Products

[Publications] 舟木慶一, 長浜貴乃: "前向き後向き予測による時変複素音声分析"日本音響学会2002年春季研究発表会講演論文集. I. 359-360 (2002)

Related Report

[Publications] 舟木慶一, 長浜貴乃: "ELSに基づく時変複素音声分析"第16回DSPシンポジウム講演論文集. (2002)

Related Report

[Publications] 舟木慶一, 長浜貴乃: "一般化最小2乗法に基づくロバスト時変複素音声分析"日本音響学会2001年春季研究発表会講演論文集. I. (2001)

Related Report

[Publications] Keiichi Funaki: "A time-varying complex ARMA speech modeling based on IV method"Proc.of MAVEBA 2001. (2001)

Related Report

[Publications] Keiichi Funaki: "A time-varying complex AR speech analysis based on GLS and ELS"Proc.of Eurospeech 2001. (2001)

Related Report

[Publications] 舟木慶一: "補助変数(IV)法を用いた時変複素AR分析"日本音響学会2000年秋季研究発表会講演論文集. I. 269-270 (2000)

Related Report

[Publications] 舟木慶一: "補助変数法に基づくロバスト時変複素音声分析"第15回ディジタル信号処理シンポジウム講演論文集. 427-432 (2000)

Related Report

[Publications] Keiichi Funaki: "A time-varying complex speech analysis based on IV"Proc.of ICSLP-2000. IV. 688-691 (2000)

Related Report

舟木慶一琉球大学, 総合情報処理センター, 講師 (30315486)