研究課題/領域番号 |
03452173
|
研究機関 | 千葉工業大学 |
研究代表者 |
城戸 健一 千葉工業大学, 工学部, 教授 (30006209)
|
研究分担者 |
牧野 正三 東北大学, 応用情報学研究センタ, 助教授 (00089806)
荒井 秀一 千葉工業大学, 工学部, 講師 (20212590)
浮貝 雅裕 千葉工業大学, 工学部, 助教授 (80118695)
菅原 研次 千葉工業大学, 工学部, 教授 (00137853)
三井田 惇郎 千葉工業大学, 工学部, 教授 (10083859)
|
キーワード | 連続音声認識 / 音声認識 / 音素認識 / 不特定話者 / 言語情報 |
研究概要 |
本年度は、前年度までの研究をまとめ、音素の認識に言語情報を利用するアルゴリズムを提案し、連続音声による音素認識実験を行なう事により本方式の評価を行なった。 前年度までの研究により、人間の音素誤認識傾向と本システムの音素誤認識傾向を近付ける事が可能になったので、人間が経験として持っている音素の誤認識に関する知識を利用する事が可能になった。 そこで、本年度は、まず、人間が経験的に持っている、音素誤認に対する誤認訂正知識をコンピュータ上の知識として表現する事を行なった。 次に、このコンピュータ上で表現された知識を用いて、音素認識システムが出力する音素ラベルを評価する方法を構築した。具体的には、ブラックボードモデルを用いて、音素認識システムが出力した音素ラベル列を時系列として順次評価していく方法を提案した。その際、誤認に関する知識を用いる事により、各音素ラベルが信頼できるか否か、さらに、信頼度が低い場合には、どの音素が誤認された結果、この音素ラベルが出力されているのかを推論している。さらに、推論の結果として、得られた訂正後の音素ラベルを用いて文章全体として整合性が取れているかを評価し、取れていない場合には、さらに別の音素候補を前記推論を繰り返す事により獲得している。 以上のように構築した連続音声認識システムを用い、認識実験を行なう事により、本方式の性能評価を行った。
|