• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

強化学習に基づく適応的な音声対話システム

Research Project

Project/Area Number 10F00050
Research Category

Grant-in-Aid for JSPS Fellows

Allocation TypeSingle-year Grants
Section外国
Research Field Perception information processing/Intelligent robotics
Research InstitutionKyoto University

Principal Investigator

河原 達也  京都大学, 学術情報メディアセンター, 教授

Co-Investigator(Kenkyū-buntansha) GOMEZ Randy  京都大学, 学術情報メディアセンター, 外国人特別研究員
GOMEZ R.B.  京都大学, 学術情報メディアセンター, 外国人特別研究員
Project Period (FY) 2010 – 2012
Project Status Completed (Fiscal Year 2012)
Budget Amount *help
¥2,100,000 (Direct Cost: ¥2,100,000)
Fiscal Year 2012: ¥600,000 (Direct Cost: ¥600,000)
Fiscal Year 2011: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2010: ¥600,000 (Direct Cost: ¥600,000)
Keywords音声認識 / 音声対話 / 残響抑圧 / 雑音抑制 / 雑音抑圧 / ウエーブレット
Research Abstract

音声は人間同士のコミュニケーションにおいて最も自然なメディアであり、計算機やロボットとのインタラクションにおいても音声対話は重要な役割を果たすと考えられる。しかしながら、実際の環境において、計算機やロボットから一定(数メートル)以上離れた状況で発話がなされると、残響等の影響が顕著となる。その結果、音声認識や発話の理解の性能が大きく低下し、円滑な対話も困難になる。従来この問題に対して、音声強調・残響抑圧の研究が行われてきたが、人間の聴感上の改善を主な目標としていたため、必ずしも音声認識やインタラクションの性能改善につながるとは限らないものであった。これに対して、音声認識やインタラクションの改善に直接的に貢献するように音声強調を行う方法について研究を行った。
今年度は特に、複数の分解能からなるウエーブレット分析の手法を研究した。提案するウエーブレットパケット分解では、遅い残響成分と音声の成分を効果的に分離するように、各々の分解能を設定する。これにより、各々に適切なウエーブレット基底を用いることで、観測された残響のある信号から効果的なウイナーゲインを計算することができる。残響抑圧は、ウエーブレットパケットの係数をウイナーゲインでフィルタすることで行われる、大語彙連続音声認識(JNASタスク)の評価実験において、提案手法はウエーブレット分析に基づく従来法や他の残響抑圧手法と比べて、高い性能を示した。

Report

(3 results)
  • 2012 Annual Research Report
  • 2011 Annual Research Report
  • 2010 Annual Research Report
  • Research Products

    (10 results)

All 2012 2011 2010

All Journal Article (5 results) (of which Peer Reviewed: 3 results) Presentation (5 results)

  • [Journal Article] Optimized wavelet-based speech enhancement for speech recognition in noisy and reverberant conditions2011

    • Author(s)
      R.Gomez, T.Kawahara
    • Journal Title

      In Proc.APSIPA ASC

    • Related Report
      2011 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Denoising using optimized wavelet filtering for automatic speech recognition2011

    • Author(s)
      R.Gomez, T.Kawahara
    • Journal Title

      In Proc.INTERSPEECH

      Pages: 1673-1676

    • Related Report
      2011 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Robust speech recognition using optimized wavelet denoising with noise profiles.2011

    • Author(s)
      Randy Gomez, Tatsuya Kawahara.
    • Journal Title

      情報処理学会研究報告

      Volume: Vol.2011-SLP-85 No.12 Pages: 1-6

    • NAID

      110007891199

    • Related Report
      2010 Annual Research Report
  • [Journal Article] Optimizing wavelet parameters for dereverberation in automatic speech recognition.2010

    • Author(s)
      R.Gomez, T.Kawahara.
    • Journal Title

      Proc.APSIPA ASC

      Pages: 446-449

    • Related Report
      2010 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Robust speech recognition using optimized wavelet filtering in reverberant conditions.2010

    • Author(s)
      Randy Gomez, Tatsuya Kawahara.
    • Journal Title

      人工知能学会研究会資料

      Volume: Challenge-B002-4 Pages: 16-21

    • Related Report
      2010 Annual Research Report
  • [Presentation] Wavelet packet decomposition approach to reverberant speech recognition2012

    • Author(s)
      Randy Gomez and Tatsuya Kavahara
    • Organizer
      情報処理学会 第92回 音声言語処理研究会
    • Place of Presentation
      滝ノ湯(山形県天童市)
    • Year and Date
      2012-07-21
    • Related Report
      2012 Annual Research Report
  • [Presentation] Wavelet packet decomposition-based dereverberation for robust asr2012

    • Author(s)
      Randy Gomez, Tatsuya Kawahara
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(横浜市)
    • Year and Date
      2012-03-13
    • Related Report
      2011 Annual Research Report
  • [Presentation] Robust speech recognition in noisy and reverberant conditions using Wiener filtering in the wavelet2011

    • Author(s)
      Randy Gomez, Tatsuya Kawahara
    • Organizer
      日本音響学会2011年秋季研究発表会
    • Place of Presentation
      島根大学(松江市)
    • Year and Date
      2011-09-21
    • Related Report
      2011 Annual Research Report
  • [Presentation] Robust Speech Recognition in Noisy and Reverberant Environments Using Wavelet-based Wiener Filtering2011

    • Author(s)
      Randy Gomez, Tatsuya Kawahara
    • Organizer
      情報処理学会第87回音声言語情報処理研究会
    • Place of Presentation
      定山渓グランドホテル瑞苑(札幌市)
    • Year and Date
      2011-07-23
    • Related Report
      2011 Annual Research Report
  • [Presentation] Wavelet optimization using noise profiles for noise-robust speech recognition.2011

    • Author(s)
      Randy Gomez, Tatsuya Kawahara.
    • Organizer
      日本音響学会2011年春季研究発表会
    • Place of Presentation
      東京都(早稲田大学)
    • Year and Date
      2011-03-10
    • Related Report
      2010 Annual Research Report

URL: 

Published: 2010-12-03   Modified: 2024-03-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi