研究課題/領域番号 |
24500201
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理・知能ロボティクス
|
研究機関 | 豊橋技術科学大学 (2012, 2014) 豊田工業高等専門学校 (2013) |
研究代表者 |
山本 一公 豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (40324230)
|
研究分担者 |
中川 聖一 豊橋技術科学大学, リーディング大学院教育推進機構, 特任教授 (20115893)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
研究課題ステータス |
完了 (2014年度)
|
配分額 *注記 |
5,330千円 (直接経費: 4,100千円、間接経費: 1,230千円)
2014年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2013年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2012年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | 音声認識 / 音響モデル / 音響特徴量 / 位相スペクトル / 群遅延スペクトル / 分析窓 / 雑音環境 / ディープニューラルネットワーク / 長時間分析 / 群遅延 / 深層学習 |
研究成果の概要 |
これまでの音声認識技術において、音声の特徴量には、主として振幅スペクトルに基づく特徴量が用いられており、位相スペクトルに基づく特徴は無視されてきた。我々は、従来用いられてきた25ms程度の分析窓長よりも長い100~200ms程度の分析窓を用いて求めた群遅延スペクトルを特徴量として音声認識を行うことで、振幅スペクトルに基づく特徴量と同程度に音声認識が可能であることを示し、また両特徴量を併用することで音声認識精度を改善できることを示した。同時に、位相スペクトルに基づく特徴量を有効に活用するために、深層学習に基づく雑音環境下音声認識のための音響モデルに関する研究を行った。
|