• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

長時間分析窓を用いて得られる位相特徴による音声認識性能の改善に関する研究

研究課題

研究課題/領域番号 24500201
研究種目

基盤研究(C)

配分区分基金
応募区分一般
研究分野 知覚情報処理・知能ロボティクス
研究機関豊橋技術科学大学 (2012, 2014)
豊田工業高等専門学校 (2013)

研究代表者

山本 一公  豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (40324230)

研究分担者 中川 聖一  豊橋技術科学大学, リーディング大学院教育推進機構, 特任教授 (20115893)
研究期間 (年度) 2012-04-01 – 2015-03-31
研究課題ステータス 完了 (2014年度)
配分額 *注記
5,330千円 (直接経費: 4,100千円、間接経費: 1,230千円)
2014年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2013年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2012年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
キーワード音声認識 / 音響モデル / 音響特徴量 / 位相スペクトル / 群遅延スペクトル / 分析窓 / 雑音環境 / ディープニューラルネットワーク / 長時間分析 / 群遅延 / 深層学習
研究成果の概要

これまでの音声認識技術において、音声の特徴量には、主として振幅スペクトルに基づく特徴量が用いられており、位相スペクトルに基づく特徴は無視されてきた。我々は、従来用いられてきた25ms程度の分析窓長よりも長い100~200ms程度の分析窓を用いて求めた群遅延スペクトルを特徴量として音声認識を行うことで、振幅スペクトルに基づく特徴量と同程度に音声認識が可能であることを示し、また両特徴量を併用することで音声認識精度を改善できることを示した。同時に、位相スペクトルに基づく特徴量を有効に活用するために、深層学習に基づく雑音環境下音声認識のための音響モデルに関する研究を行った。

報告書

(4件)
  • 2014 実績報告書   研究成果報告書 ( PDF )
  • 2013 実施状況報告書
  • 2012 実施状況報告書
  • 研究成果

    (7件)

すべて 2015 2014 2013 2012

すべて 学会発表 (7件)

  • [学会発表] Noise-aware trainingとSSを併用したDNN-HMM音響モデルの雑音下音声認識の評価2015

    • 著者名/発表者名
      阿部晃大, 山本一公, 中川聖一
    • 学会等名
      日本音響学会2015年春季研究発表会
    • 発表場所
      中央大学後楽園キャンパス
    • 年月日
      2015-03-16 – 2015-03-18
    • 関連する報告書
      2014 実績報告書
  • [学会発表] Speech recognition based on Itakura-Saito divergence and dynamics / sparseness constraints from mixed sound of speech and music by non-negative matrix factorization2014

    • 著者名/発表者名
      Naoki Hashimoto, Kazumasa Yamamoto, Seiichi Nakagawa
    • 学会等名
      INTERSPEECH 2014
    • 発表場所
      Singapore EXPO(シンガポール)
    • 年月日
      2014-09-15 – 2014-09-18
    • 関連する報告書
      2014 実績報告書
  • [学会発表] Comparison of syllable-based and phoneme-based DNN-HMM in Japanese speech recognition2014

    • 著者名/発表者名
      Hiroshi Seki, Kazumasa Yamamoto, Seiichi Nakagawa
    • 学会等名
      International Conference on Advanced Infomatics: Concepts, Theory and Applications (ICAICTA 2014)
    • 発表場所
      バンドン工科大学(インドネシア)
    • 年月日
      2014-08-20 – 2014-08-21
    • 関連する報告書
      2014 実績報告書
  • [学会発表] Fast NMF based approach and VQ based approach using MFCC distance measure for speech recognition from mixed sound2013

    • 著者名/発表者名
      Shoichi Nakano, Kazumasa Yamamoto, Seiichi Nakagawa
    • 学会等名
      2013 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference
    • 発表場所
      Kaohsiung, Taiwan
    • 関連する報告書
      2013 実施状況報告書
  • [学会発表] NMF による音楽重畳音声の音声認識の改善2013

    • 著者名/発表者名
      橋本尚亮, 仲野翔一, 山本一公, 中川聖一
    • 学会等名
      日本音響学会2013年秋季研究発表会
    • 発表場所
      豊橋技術科学大学
    • 関連する報告書
      2013 実施状況報告書
  • [学会発表] ケプストラム距離に基づくNMFの高速化手法とVQ手法による音楽重畳音声の認識2013

    • 著者名/発表者名
      仲野翔一, 山本一公, 中川聖一
    • 学会等名
      日本音響学会2013年春季研究発表会
    • 発表場所
      東京工科大学
    • 関連する報告書
      2012 実施状況報告書
  • [学会発表] Fast NMF based approach and improved VQ based approach for speech recognition from mixed sound2012

    • 著者名/発表者名
      Shoichi Nakano, Kazumasa Yamamoto, Seiichi Nakagawa
    • 学会等名
      Asia-Pacific Signal and Information Processing Association (APSIPA) Annual Summit and Conference (ASC) 2012
    • 発表場所
      アメリカ, ハリウッド
    • 関連する報告書
      2012 実施状況報告書

URL: 

公開日: 2013-05-31   更新日: 2019-07-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi