ゆっくり喋ると認識されやすい音声認識システムの開発

研究課題

研究課題/領域番号	18700174
研究種目	若手研究(B)
配分区分	補助金
研究分野	知覚情報処理・知能ロボティクス
研究機関	豊橋技術科学大学 (2007-2008) 信州大学 (2006)
研究代表者	山本一公豊橋技術科学大学, 工学部, 助教 (40324230)
研究期間 (年度)	2006 – 2008
研究課題ステータス	完了 (2008年度)
配分額 *注記	3,540千円 (直接経費: 3,300千円、間接経費: 240千円) 2008年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円) 2007年度: 800千円 (直接経費: 800千円) 2006年度: 1,700千円 (直接経費: 1,700千円)
キーワード	音声認識 / 発話速度変動 / 挿入ペナルティ / 言語重み / 訂正発話 / 発話速度推定 / 対角共分散行列 / 全共分散行列 / 自然発話音声 / 発音変動 / 音響モデル / 信頼度 / 分布間距離
研究概要	音声認識システムを使用時に誤認識が発生すると、人間であるユーザは訂正発話をゆっくりとした発話速度で行う傾向があるが、現在の音声認識システムはゆっくりした発話速度の音声の認識精度が悪いため悪循環となっている。本研究では、発話速度を自動推定し、その結果から最適な音声認識システムパラメータ(挿入ペナルティ、言語重み)を自動的に調整することでゆっくりした発話速度の音声の認識精度を大幅に改善した。

報告書

(4件)