研究課題/領域番号 |
16K00227
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理
|
研究機関 | 山形大学 |
研究代表者 |
小坂 哲夫 山形大学, 大学院理工学研究科, 教授 (50359569)
|
研究協力者 |
加藤 正治
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2018年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2017年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2016年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
|
キーワード | 音声認識 / 音響モデル / ディープニューラルネットワーク / 適応技術 / 話し言葉 / 感情音声 / 音声区間検出 / ディープラーニング / 感情音声認識 / ニューラルネットワーク / 話者適応 |
研究成果の概要 |
近年ディープラーニングにもとづく音声認識が大きな成果を挙げているが,話し言葉についてはまだ十分な結果は得られていない.認識性能の低下の大きな原因として話者の個人性,多様な音響環境,多様な発話スタイルなどが挙げられる.これらを解決するために音響モデル適応を中心とした技術を検討し,認識性能の向上を図った.結果として話し言葉音声や感情音声の認識精度の向上,雑音下における音声区間検出の性能向上を達成した.
|
研究成果の学術的意義や社会的意義 |
本研究により,1)話し言葉音声認識における適応精度の向上,2)雑音下音声区間検出の精度向上,3)感情音声認識の性能向上を達成した.1)は話し言葉音声認識に限らず,異なる分野においても応用可能な適応手法で汎用性の高い技術である.2)の成果を利用してマルチモーダル対話コーパスが整備されており,当該分野の研究者にとって有益と考えられる.また3)についてもロボットと人間との会話など様々な分野に利用が可能である.以上,本研究で開発した技術は波及効果が高く,学術的,社会的意義が高いと考えられる.
|