• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

Hilbert再生核空間の正規法による頑健音声処理

Research Project

Project/Area Number 22700193
Research InstitutionNational Institute of Information and Communications Technology

Principal Investigator

LU Xugang  独立行政法人情報通信研究機構, 知識創成コミュニケーション研究センター・音声コミュニケーショングループ, 専攻研究員 (20362022)

Keywords再生核ヒルベルト空間 / 統計学習 / 音声信号処理 / 再生核空間の正規法
Research Abstract

従来の音声信号処理では、線形で次数の低い(2次以下の)音声統計構造を扱っている。このように抽出されたものの特徴として、ノイズと音声が混在するため、ロバスト性が不足している。本プロジェクトの目的は、統計学習理論をベースにして、新しい音声信号処理の仕組みを開発することである。この新しい仕組みに、再生核ヒルベルト空間(Kernel Hilbert Space : RKHS)で非線形マッピング関数を用いて、非線形で高次の音声統計情報を抽出し、同時にノイズ構造が排除されるという考えがある。この新しい特徴量は実音声通信などの応用、例えば、音声有無の検出、音声認識音声強調に対して、従来の特徴量よりロバスト性があることを期待する。我々が提案したアルゴリズムはデータ駆動学習法である。従って、クリーンな音声及びノイズを含む音声コーパスの構築が必要である。まず、言語内容モデルにあまり強く依存しない連続数字列を設計する。それから四種類の雑音、例えば、自動車ノイズ、街頭ノイズ、爆発ノイズ、及び展示会ノイズを選定する。これらのノイズ付き音声に人工的にSNR(Signal to Noise Ratio)を20dB,15dB,10dB,5dB,0dB,及び-5dBのレベルにセットする(本プロジェクトの最終段階、収集した実ノイズ音声を使って、音声有無の検出及びロバストな音声認識実験を行う予定である).データ・コーパスを基礎にして、統計学習仕組みを設計する。この仕組みは、データ依存の核関数の選択、最適調整パラメータの選択および快速アルゴリズムの実装という数ステップを含む。主なターゲットは、RKHSで期待の性質を持つ近似アルゴリズムを適切に設計する。例えば、ノイズ構造を平滑化した後、音声構造を保つようにする。すべてのステップは実験で考察、洗練される.

  • Research Products

    (5 results)

All 2011 2010

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (4 results)

  • [Journal Article] Sub-band temporal modulation envelopes and their normalization for automatic speech recognition in reverberant environments2011

    • Author(s)
      X.Lu, M.Unoki, S.Nakamura
    • Journal Title

      Computer Speech and Language

      Volume: 25 Pages: 571-584

    • DOI

      10.1016/j.cs1.2010.10.002

    • Peer Reviewed
  • [Presentation] Functional Approximation in a Reproducing Kernel Hilbert Space for Speech Estimation in Noisy Environments2010

    • Author(s)
      Xugang Lu
    • Organizer
      the Second Asia-Pacific Signal and Information Association Annual Summit and Conference
    • Place of Presentation
      Biopolis, Singapore
    • Year and Date
      2010-12-15
  • [Presentation] Speech enhancement as a functional approximation and generalization2010

    • Author(s)
      Xugang Lu
    • Organizer
      International Symposium on Chinese Spoken Language Processing, 2010
    • Place of Presentation
      Tanan, Taiwan
    • Year and Date
      2010-11-30
  • [Presentation] Regularization in a reproducing kernel Hilbert space for robust voice activity detection2010

    • Author(s)
      Xugang Lu
    • Organizer
      10th International Conference on Signal Processing
    • Place of Presentation
      Beijing, China
    • Year and Date
      2010-10-25
  • [Presentation] Voice activity detection in a regularized reproducing kernel Hilbert space2010

    • Author(s)
      Xugang Lu
    • Organizer
      INTERSPEECH
    • Place of Presentation
      Makuhari Messe International Convention Complex, Chiba, Japan
    • Year and Date
      2010-09-27

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi