• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 研究成果報告書

長時間分析窓を用いて得られる位相特徴による音声認識性能の改善に関する研究

研究課題

  • PDF
研究課題/領域番号 24500201
研究種目

基盤研究(C)

配分区分基金
応募区分一般
研究分野 知覚情報処理・知能ロボティクス
研究機関豊橋技術科学大学 (2012, 2014)
豊田工業高等専門学校 (2013)

研究代表者

山本 一公  豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (40324230)

研究分担者 中川 聖一  豊橋技術科学大学, リーディング大学院教育推進機構, 特任教授 (20115893)
研究期間 (年度) 2012-04-01 – 2015-03-31
キーワード音声認識 / 音響モデル / 音響特徴量 / 位相スペクトル / 群遅延スペクトル / 分析窓 / 雑音環境 / ディープニューラルネットワーク
研究成果の概要

これまでの音声認識技術において、音声の特徴量には、主として振幅スペクトルに基づく特徴量が用いられており、位相スペクトルに基づく特徴は無視されてきた。我々は、従来用いられてきた25ms程度の分析窓長よりも長い100~200ms程度の分析窓を用いて求めた群遅延スペクトルを特徴量として音声認識を行うことで、振幅スペクトルに基づく特徴量と同程度に音声認識が可能であることを示し、また両特徴量を併用することで音声認識精度を改善できることを示した。同時に、位相スペクトルに基づく特徴量を有効に活用するために、深層学習に基づく雑音環境下音声認識のための音響モデルに関する研究を行った。

自由記述の分野

音声言語情報処理

URL: 

公開日: 2016-06-03  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi