• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

実世界劣化音声コーパスに基づく音声強調法の研究

Research Project

Project/Area Number 19300060
Research InstitutionNagoya University

Principal Investigator

武田 一哉  Nagoya University, 大学院・情報科学研究科, 教授 (20273295)

Co-Investigator(Kenkyū-buntansha) 北岡 教英  名古屋大学, 大学院・情報科学研究科, 准教授 (10333501)
山田 武志  筑波大学, 大学院・システム情報工学研究科, 准教授 (20312829)
滝口 哲也  神戸大学, 都市安全研究センター, 講師 (40397815)
西浦 敬信  立命館大学, 情報理工学部, 准教授 (70343275)
山本 一公  豊橋技術科学大学, 工学部, 助教 (40324230)
Keywords雑音下音声認識 / 加法性雑音 / 乗法性雑音 / 音声区間検出 / 音声認識評価基盤
Research Abstract

これまでに収集した加法性雑音下音声認識評価基盤(CENSREC-1,2,3)に加えて乗法性雑音下音声認識評価用のデータベースを作成した。本DBには8種類の実環境で収集した残響(=乗法性雑音)をクリーン音声に畳み込んでシミュレートされた残響下音声、およびそのうち4環境では加法性雑音も加えた音声、その環境で実際に人間がその場で発声した実音声も収録した。そしてそれらのデータに基づいて音声認識の性能評価が行える評価基盤をCENSREC-4として構築した。これらの評価基盤はCENSRECシリーズとして一般にも公開され、CENSREC-4はすでに30部以上が配布されており、日本および世界での研究促進に寄与する。また、雑音下で音声が変形するロンバード効果についても分析し、今後のデータ収集への検討を開始した。
また、雑音や残響の音声認識への影響を分析し、それらを測る評価指標を考案し、事前に音声認識への影響を推測する方法の研究を行い、効果を得た。雑音下音声認識で効果的な音声区間検出については、本研究グループにより作成された雑音下音声区間検出評価基盤CENSREC-1-Cを用いたシミュレーション実験によりその効果を確認し、音声認識性能向上の指針を示した。音声区間検出手法の研究も行い、高次統計量を用いた高精度な音声区間検出手法、画像を組み合わせたアプローチなどを提案した。
加法性雑音下音声認識に関しては、その多様性を直接的に扱って多様な音響モデルを選択的に用いることにより高精度に認識する手法を提案して効果を得た。

  • Research Products

    (19 results)

All 2008 2007

All Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (15 results)

  • [Journal Article] Noisy Speech Recognition Based on Integration/Selection of Multiple Noise Suppression Methods Using Noise GMMs2008

    • Author(s)
      Norihide Kitaoka, Souta Hamaguchi, Seiichi Nakagawa
    • Journal Title

      IEICE Transactions on Information and Systems Vol.E91-D

      Pages: 411-421

    • Peer Reviewed
  • [Journal Article] Omnidirectional Audio-Visual Talker Localization Based on Dynamic Fusion of Audio-Visual Features Using Validity and Reliability Criteria2008

    • Author(s)
      Yuki Denda, Takanobu Nishiura, and Yoichi Yamashita
    • Journal Title

      IEICE Transactions on Information and Systems Vol.E91-D

      Pages: 598-606

    • Peer Reviewed
  • [Journal Article] 音声と画像の統合によるドライバの発話区間検出2008

    • Author(s)
      二宮 芳樹, 坂 義秀, 前野 俊希, 根木 大輔, 宮島 千代美, 森 健策, 北坂孝幸, 末永 康仁
    • Journal Title

      映像情報メディア学会誌 vol.62

      Pages: 435-441

    • Peer Reviewed
  • [Journal Article] 多様な音響環境下における音声認識システム利用時のデータ収集システム2007

    • Author(s)
      原 直, 宮島 千代美, 伊藤 克亘, 武田 一哉
    • Journal Title

      電子情報通信学会論文誌 vol.J90-D

      Pages: 2807-2816

    • Peer Reviewed
  • [Presentation] Development of VAD evaluation framework CENSREC-1-C and investigation of relationship between VAD and speech recognition perf2008

    • Author(s)
      Norihide Kitaoka, Kazumasa Yamamoto, Tomohiro Kusamizu, Seiichi Nakagawa, Takeshi Yamada, Satoru Tsuge, Chiyomi Miyajima, Takanobu Nishiura, Masato Nakayama, Yuki Denda, Masakiyo Fujimoto, Tetsuya Takiguchi, Satoshi Tamura, Shingo Kuroiwa, Kazuya Takeda, Satoshi Nakamura
    • Organizer
      IEEE ASRU-2007
    • Place of Presentation
      The Westin Miyako Kyoto
    • Year and Date
      2008-12-12
  • [Presentation] 多数の雑音抑圧手法を用いた雑音下音声認識の検討2008

    • Author(s)
      河野太一, 山田武志, 北脇信彦
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉工業大学
    • Year and Date
      2008-03-17
  • [Presentation] 雑音下音声認識の性能推定に適したひずみ尺度の検討2008

    • Author(s)
      橋本倫和, 山田武志, 北脇信彦
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉工業大学
    • Year and Date
      2008-03-17
  • [Presentation] 認識タスクを考慮した雑音下音声認識の性能推定の検討2008

    • Author(s)
      中島智弘, 山田武志, 北脇信彦
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉工業大学
    • Year and Date
      2008-03-17
  • [Presentation] 室内音響指標を用いた残響下音声認識性能の評価2008

    • Author(s)
      平野 良季, 傳田 遊亀, 中山 雅人, 西浦 敬信
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉工業大学
    • Year and Date
      2008-03-17
  • [Presentation] 残響下音声認識評価基盤(CENSREC-4)の構築2008

    • Author(s)
      西浦 敬信, 中山 雅人, 傳田 遊亀, 北岡 教英, 山本 一公, 山田 武志, 藤本 雅清, 柘植 覚, 宮島 千代美, 滝口 哲也, 田村 哲嗣, 小川 哲司, 松田 繁樹, 黒岩 眞吾, 武田 一哉, 中村 哲
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉工業大学
    • Year and Date
      2008-03-17
  • [Presentation] VADが音声認識性能に与える影響についての検討2008

    • Author(s)
      草水智浩, 山本一公, 北岡教英, 中川聖一
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉工業大学
    • Year and Date
      2008-03-17
  • [Presentation] 雑音下音声認識評価ワーキンググループ活動報告:認識に影響する要因の個別評価環境(2)2007

    • Author(s)
      北岡教英, 山田武志, 滝口哲也, 柘植覚, 山本一公, 宮島千代美, 西浦敬 信, 中山雅人, 傳田遊亀, 藤本雅清, 田村哲嗣, 松田繁樹, 小川哲司, 黒岩眞吾, 武田一哉, 中村哲
    • Organizer
      第9回音声言語シンポジウム
    • Place of Presentation
      NTT CS基礎研究所
    • Year and Date
      2007-12-20
  • [Presentation] 雑音下音声認識の性能推定のためのひずみ尺度の検討2007

    • Author(s)
      橋本倫和, 山田武志, 北脇信彦
    • Organizer
      第9回音声言語シンポジウム
    • Place of Presentation
      NTT CS基礎研究所
    • Year and Date
      2007-12-20
  • [Presentation] 3次キュムラントバイスペクトラム特徴とReal AdaBoostによる音声区間検出2007

    • Author(s)
      松田博義, 滝口哲也, 有木康雄
    • Organizer
      日本音響学会2007年秋季研究発表会
    • Place of Presentation
      山梨大学
    • Year and Date
      2007-09-19
  • [Presentation] 室内音響指標を用いた残響下音声認識性能の分析と推定2007

    • Author(s)
      平野 良季, 傳田 遊亀, 中山 雅人, 西浦 敬信
    • Organizer
      日本音響学会2007年秋季研究発表会
    • Place of Presentation
      山梨大学
    • Year and Date
      2007-09-19
  • [Presentation] VADが音声認識性能に与える影響2007

    • Author(s)
      草水智浩, 山本一公, 北岡教英, 中川聖一
    • Organizer
      FIT2007
    • Place of Presentation
      中京大学 豊田キャンパス
    • Year and Date
      2007-09-06
  • [Presentation] A Study of Suitable Reverberation Criteria for Distant-talking Speech Recognition With Room Acoustic Parameters2007

    • Author(s)
      Takanobu Nishiura, Yoshiki Hirano, Yuki Denda, and Masato Nakayama
    • Organizer
      ICA2007
    • Place of Presentation
      Madrid, Spain
    • Year and Date
      2007-09-04
  • [Presentation] Investigations into Early and Late Reflections on Distant-talking Speech Recognition Toward Suitable Reverberation Criteria2007

    • Author(s)
      Takanobu Nishiura, Yoshiki. Hirano, Yuki Denda, and Masato Nakayama
    • Organizer
      INTERSPEECH 2007
    • Place of Presentation
      Antwerp, Belgium
    • Year and Date
      2007-08-29
  • [Presentation] Omnidirectional Audio-Visual Talker Localizer With Dynamic Feature Fusion Based on Validity and Reliability Criteria2007

    • Author(s)
      Yuki Denda, Takanobu Nishiura, and Yoichi Yamashita
    • Organizer
      INTERSPEECH 2007
    • Place of Presentation
      Antwerp, Belgium
    • Year and Date
      2007-08-29

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi