2010 Fiscal Year Annual Research Report
Hilbert再生核空間の正規法による頑健音声処理
Project/Area Number |
22700193
|
Research Institution | National Institute of Information and Communications Technology |
Principal Investigator |
LU Xugang 独立行政法人情報通信研究機構, 知識創成コミュニケーション研究センター・音声コミュニケーショングループ, 専攻研究員 (20362022)
|
Keywords | 再生核ヒルベルト空間 / 統計学習 / 音声信号処理 / 再生核空間の正規法 |
Research Abstract |
従来の音声信号処理では、線形で次数の低い(2次以下の)音声統計構造を扱っている。このように抽出されたものの特徴として、ノイズと音声が混在するため、ロバスト性が不足している。本プロジェクトの目的は、統計学習理論をベースにして、新しい音声信号処理の仕組みを開発することである。この新しい仕組みに、再生核ヒルベルト空間(Kernel Hilbert Space : RKHS)で非線形マッピング関数を用いて、非線形で高次の音声統計情報を抽出し、同時にノイズ構造が排除されるという考えがある。この新しい特徴量は実音声通信などの応用、例えば、音声有無の検出、音声認識音声強調に対して、従来の特徴量よりロバスト性があることを期待する。我々が提案したアルゴリズムはデータ駆動学習法である。従って、クリーンな音声及びノイズを含む音声コーパスの構築が必要である。まず、言語内容モデルにあまり強く依存しない連続数字列を設計する。それから四種類の雑音、例えば、自動車ノイズ、街頭ノイズ、爆発ノイズ、及び展示会ノイズを選定する。これらのノイズ付き音声に人工的にSNR(Signal to Noise Ratio)を20dB,15dB,10dB,5dB,0dB,及び-5dBのレベルにセットする(本プロジェクトの最終段階、収集した実ノイズ音声を使って、音声有無の検出及びロバストな音声認識実験を行う予定である).データ・コーパスを基礎にして、統計学習仕組みを設計する。この仕組みは、データ依存の核関数の選択、最適調整パラメータの選択および快速アルゴリズムの実装という数ステップを含む。主なターゲットは、RKHSで期待の性質を持つ近似アルゴリズムを適切に設計する。例えば、ノイズ構造を平滑化した後、音声構造を保つようにする。すべてのステップは実験で考察、洗練される.
|