2011 Fiscal Year Annual Research Report
Hilbert再生核空間の正規法による頑健音声処理
Project/Area Number |
22700193
|
Research Institution | National Institute of Information and Communications Technology |
Principal Investigator |
LU Xugang 独立行政法人情報通信研究機構, ユニバーサルコミュニケーション研究所・音声コミュニケーション研究室, 専攻研究員 (20362022)
|
Keywords | 再生核ヒルベルト空間 / 統計学習 / 音声信号処理 / 再生核空間の正規法 |
Research Abstract |
従来の音声信号処理では、線形で次数の低い(2次以下の)音声統計構造を扱っている。このように抽出されたものの特徴として、ノイズと音声が混在するため、ロバスト性が不足している。本プロジェクトの目的は、統計学習理論をベースにして、新しい音声信号処理の仕組みを開発することである。 この新しい仕組みに、再生核ヒルベルト空間(Kernel Hilbert Space:RKHS)で非線形マッピング関数を用いて、非線形で高次の音声統計情報を抽出し、同時にノイズ構造が排除されるという考えがある。 この新しい特徴量は実音声通信などの応用。 我々は、前からノイズ減少や音声推定のために正規法フレームワーク手法を提案した。この研究手法に、定常的な正規パラメータが使われていた。音声及びノイズが非定常の性質を持つことを考慮した上、我々は更に適応正規フレームワーク手法を開発した。正規パラメータはローカルSN比(signal to noise ratio)に依存する。この適応正規に基いて、従来より、ノイズ減少と音声歪みの間の良いトレッドオフが獲得した。提案した音声推定フレームワークは、音声増強、自動音声認識(ASR)及び音声有無の検出(VAD)に応用できる。提案した正規法フレームワークを検証するために、以下のタスクに対するアプリケーションアルゴリズムを設計する:(a)音声増強(b)音声認識、(c)音声有無の検出.その以外、提案するアルゴリズムと既存の優れたアルゴリズムを比較する。
|