• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

実世界劣化音声コーパスに基づく音声強調法の研究

Research Project

Project/Area Number 19300060
Research InstitutionNagoya University

Principal Investigator

武田 一哉  Nagoya University, 大学院・情報科学研究科, 教授 (20273295)

Co-Investigator(Kenkyū-buntansha) 北岡 教英  名古屋大学, 大学院・情報科学研究科, 准教授 (10333501)
山田 武志  筑波大学, 大学院・システム情報工学研究科, 准教授 (20312829)
西浦 敬信  立命館大学, 情報理工学部, 准教授 (70343275)
宮島 千代美  名古屋大学, 大学院・情報科学研究科, 助教 (90335092)
田村 哲嗣  岐阜大学, 工学部, 助教 (10402215)
Keywords雑音下立声認識 / 乗法性雑音 / 音声区間検出 / ロンバード効果 / Audio-visual音声認識 / 音声認識評価基盤
Research Abstract

雑音下音声認識の標準評価基盤(=データ+標準認識手法)であるCENSRECシリーズの開発に関しては,昨年の予備的収録から引き続きロンバード効果音声の本格収録を行った。また、Audio-visual音声認識データベースCENSREC-AVの整備も行った。当初目標の,さまざまな音声劣化要因を体系化すること、および体系化された劣化要因のデータベース化を達成した。CENSRECシリーズの配布総数は数百となっている。そして,これらの成果は,これまでに構築したCENSRECシリーズとともに、COMPUTER PROCESSING OF ASIAN SPOKEN LANGUAGESという書籍中にいくつかのSectionとして紹介されることとなり、本研究のメンバーが著者となり執筆した。
劣化音声の認識手法として,劣化に頑健な特徴抽出法,スペクトルサブトラクションを繰り返し行ってミュージカルノイズと呼ばれる引き残り雑音を低減する手法,音声波形の周波数ごとの位相情報を利用する手法,複数マイクロフォンを用いて空間情報を用いる手法など,さまざまなアプローチを試み,効果を確認した。その一部はデータベースとともにDVDに収録され、パッケージとして公開するという目標を達成した。
さらにこれらの研究成果を元に,日本音響学会誌の小特集「自動音声認識研究の動向と展望」において,「音声認識におけるロバストネス」という解説記事を執筆し,一般的な劣化音声認識の研究動向とともに本研究の成果物である標準評価基盤を紹介した。

  • Research Products

    (20 results)

All 2010 2009

All Journal Article (11 results) (of which Peer Reviewed: 6 results) Presentation (9 results)

  • [Journal Article] Speaker identification by combining MFCC and phase information in noisy environments2010

    • Author(s)
      Longbiao Wang
    • Journal Title

      Proceedings of ICASSP2010

      Pages: 4502-4505

    • Peer Reviewed
  • [Journal Article] Large In-car speech corpus for Integrated Acoustic Information Research2010

    • Author(s)
      Shigeki Matsubara
    • Journal Title

      COMPUTER PROCESSING OF ASIAN SPOKEN LANGUAGES (書籍) Section 4.3.1

      Pages: 5

  • [Journal Article] An evaluation database for in-car speech recognition and its common evaluation framework2010

    • Author(s)
      Masakiyo Fujimoto
    • Journal Title

      COMPUTER PROCESSING OF ASIAN SPOKEN LANGUAGES (書籍) Section 4.3.2

      Pages: 5

  • [Journal Article] Multimodal speech corpora for robust Japanese speech recognition in noisy environments2010

    • Author(s)
      Satoshi Tamura
    • Journal Title

      COMPUTER PROCESSING OF ASIAN SPOKEN LANGUAGES (書籍) Section 4.9.3

      Pages: 5

  • [Journal Article] Evaluation frameworks for noisy speech recognition2010

    • Author(s)
      北岡教英
    • Journal Title

      COMPUTER PROCESSING OF ASIAN SPOKEN LANGUAGES (書籍) Section 5.2.3

      Pages: 5

  • [Journal Article] 音声認識におけるロバストネス," 小特集---自動音声認識研究の動向と展望--- (解説記事)2010

    • Author(s)
      北岡教英
    • Journal Title

      日本音響学会誌 66

      Pages: 23-27

  • [Journal Article] Automatic estimation of position and orientation of an acoustic source by a microphone array network2009

    • Author(s)
      Alberto Yoshihiro Nakano
    • Journal Title

      Journal of Acoustical Society of America Vol. 126

      Pages: 3084-3094

    • Peer Reviewed
  • [Journal Article] Estimating the position and orientation of an acoustic source with a microphone array network2009

    • Author(s)
      Alberto Yoshihiro Nakano
    • Journal Title

      Proceedings of INTERSPEECH2009

      Pages: 1127-1130

    • Peer Reviewed
  • [Journal Article] CENSREC-1-C : An evaluation framework for voice activity detection under noisy environments2009

    • Author(s)
      北岡教英
    • Journal Title

      Acoustical Science and Technology 30

      Pages: 363-371

    • Peer Reviewed
  • [Journal Article] Gradient-Based Acoustic Features for Speech Recognition2009

    • Author(s)
      Takashi Muroi
    • Journal Title

      2009 International Symposium on Intelligent Signal Processing and Communication Systems

      Pages: 445-448

    • Peer Reviewed
  • [Journal Article] 母音/子音特徴量に基づく適応形マイクロホンアレーを用いた雑音下音声認識2009

    • Author(s)
      中山雅人
    • Journal Title

      電子情報通信学会論文誌 (D) Vol. J92-D, No. 9

      Pages: 1568-1578

    • Peer Reviewed
  • [Presentation] ロンバード音声の特徴量分析と認識性能改善法の一検討2010

    • Author(s)
      植村祐二, 森勢将雅, 西浦敬信
    • Organizer
      日本音響学会2010年春季研究発表会
    • Place of Presentation
      電気通信大学 (東京都)
    • Year and Date
      2010-03-09
  • [Presentation] Speaker vector combination method of air- and bone-conduction speech for speaker identification2010

    • Author(s)
      Masafumi Nakao
    • Organizer
      NCSP' 10
    • Place of Presentation
      Waikiki Beach Marriott Resort & Spa, Honolulu, Hawaii, USA
    • Year and Date
      2010-03-04
  • [Presentation] ランダムプロジェクションを用いた音響モデルの線形変換2009

    • Author(s)
      吉井麻里子
    • Organizer
      第79回音声言語情報処理研究会
    • Place of Presentation
      東京大学 (東京都)
    • Year and Date
      2009-12-22
  • [Presentation] Speaker verification method using bone-conduction and air-conduction speech2009

    • Author(s)
      Satoru Tsuge
    • Organizer
      ISPACS 2009
    • Place of Presentation
      金沢エクセルホテル東急 (石川県)
    • Year and Date
      2009-12-08
  • [Presentation] Distant speech recognition using spatial information estimated by a microphone array network2009

    • Author(s)
      Alberto Yoshihiro Nakano
    • Organizer
      日本音響学会2009年秋季研究発表会
    • Place of Presentation
      日本大学 (福島県)
    • Year and Date
      2009-09-15
  • [Presentation] ロンバード発声音声コーパスの設計と評価2009

    • Author(s)
      小川哲司, 他
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      日本大学 (福島県)
    • Year and Date
      2009-09-15
  • [Presentation] 反復スペクトルサブトラクションにおけるミュージカルノイズ低減法の検討2009

    • Author(s)
      西川浩太郎, 森勢将雅, 西浦敬信, 南條浩輝
    • Organizer
      日本音響学会2009年秋季研究発表会
    • Place of Presentation
      日本大学 (福島県)
    • Year and Date
      2009-09-15
  • [Presentation] 繰り返し発声を用いた突発性雑音に頑健な音声認識に関する研究2009

    • Author(s)
      柏原康徳
    • Organizer
      平成21年度電気学会電子情報システム部門大会
    • Place of Presentation
      徳島大学 (徳島県)
    • Year and Date
      2009-09-04
  • [Presentation] 気導音と骨導音を併用した話者ベクトルを用いた話者識別2009

    • Author(s)
      中尾昌史
    • Organizer
      平成21年度電気学会電子情報システム部門大会
    • Place of Presentation
      徳島大学 (徳島県)
    • Year and Date
      2009-09-04

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi