• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実績報告書

長時間分析窓を用いて得られる位相特徴による音声認識性能の改善に関する研究

研究課題

研究課題/領域番号 24500201
研究機関豊橋技術科学大学

研究代表者

山本 一公  豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (40324230)

研究分担者 中川 聖一  豊橋技術科学大学, その他部局等, 教授 (20115893) [辞退]
研究期間 (年度) 2012-04-01 – 2015-03-31
キーワード音声認識 / 音響特徴量 / 位相スペクトル / 長時間分析 / 群遅延 / 音響モデル / 深層学習 / 雑音環境
研究実績の概要

音声認識に使われている音響特徴量は、振幅スペクトルに基づくものがほとんどであり、人間の聴覚特性が位相変化に対して比較的鈍感であるという聴覚主観評価実験の結果に基づいて、位相スペクトルは特徴量としては無視されてきた。しかし、最近の研究で、位相スペクトルにも音声認識が可能となる情報が含まれていることが分かってきた。そこで、本研究では、従来無視されてきた位相スペクトルを効果的な特徴量として音声認識に用いる方法について検討を行った。
本年度は、昨年度までに行った研究から継続して、実環境大語彙連続音声認識において、位相特徴を用いる方法について検討を行った。音響モデルとしては昨年度検討を行ったDeep Neural Network (DNN)を用いたDNN-HMMを用いた。しかしながら、昨年度までと同じような形で特徴量を統合しても、認識精度の改善はほとんど得られず、雑音環境下においては、むしろ位相特徴を用いることで認識精度が低下してしまう現象が見られた。これは、雑音環境下で正確に位相情報(群遅延)を求めることが難しいためであると考えられる。
そこで、実環境下で頑健な認識が行えるように、方針を一部改めることとした。まず、DNN-HMMを用いた音響モデルによって、雑音環境下で頑健な音声認識を行うための特徴量入力手段を検討し、その後それに位相情報(時間情報)を追加するという方針である。DNN-HMMへの特徴量入力手段としては、スペクトルサブトラクションにより前処理を施して雑音を低減した音声特徴量と共に雑音情報を入力することで、DNN内部での雑音に対する頑健性を向上させ、認識精度を向上させることができた。位相は音声波形のエネルギーに関する時間情報を表すことが分かり、位相情報の追加方法として、時間領域ガンマトーンフィルタによる特徴抽出とDNNへの入力を試みたが、残念ながらこちらはまだ道半ばという状況である。

  • 研究成果

    (3件)

すべて 2015 2014

すべて 学会発表 (3件)

  • [学会発表] Noise-aware trainingとSSを併用したDNN-HMM音響モデルの雑音下音声認識の評価2015

    • 著者名/発表者名
      阿部晃大, 山本一公, 中川聖一
    • 学会等名
      日本音響学会2015年春季研究発表会
    • 発表場所
      中央大学後楽園キャンパス
    • 年月日
      2015-03-16 – 2015-03-18
  • [学会発表] Speech recognition based on Itakura-Saito divergence and dynamics / sparseness constraints from mixed sound of speech and music by non-negative matrix factorization2014

    • 著者名/発表者名
      Naoki Hashimoto, Kazumasa Yamamoto, Seiichi Nakagawa
    • 学会等名
      INTERSPEECH 2014
    • 発表場所
      Singapore EXPO(シンガポール)
    • 年月日
      2014-09-15 – 2014-09-18
  • [学会発表] Comparison of syllable-based and phoneme-based DNN-HMM in Japanese speech recognition2014

    • 著者名/発表者名
      Hiroshi Seki, Kazumasa Yamamoto, Seiichi Nakagawa
    • 学会等名
      International Conference on Advanced Infomatics: Concepts, Theory and Applications (ICAICTA 2014)
    • 発表場所
      バンドン工科大学(インドネシア)
    • 年月日
      2014-08-20 – 2014-08-21

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi