1993 Fiscal Year Annual Research Report
連続音声認識のための音素認識における言語情報利用に関する研究
Project/Area Number |
03452173
|
Research Institution | Chiba Institute of Technology |
Principal Investigator |
城戸 健一 千葉工業大学, 工学部, 教授 (30006209)
|
Co-Investigator(Kenkyū-buntansha) |
牧野 正三 東北大学, 応用情報学研究センタ, 助教授 (00089806)
荒井 秀一 千葉工業大学, 工学部, 講師 (20212590)
浮貝 雅裕 千葉工業大学, 工学部, 助教授 (80118695)
菅原 研次 千葉工業大学, 工学部, 教授 (00137853)
三井田 惇郎 千葉工業大学, 工学部, 教授 (10083859)
|
Keywords | 連続音声認識 / 音声認識 / 音素認識 / 不特定話者 / 言語情報 |
Research Abstract |
本年度は、前年度までの研究をまとめ、音素の認識に言語情報を利用するアルゴリズムを提案し、連続音声による音素認識実験を行なう事により本方式の評価を行なった。 前年度までの研究により、人間の音素誤認識傾向と本システムの音素誤認識傾向を近付ける事が可能になったので、人間が経験として持っている音素の誤認識に関する知識を利用する事が可能になった。 そこで、本年度は、まず、人間が経験的に持っている、音素誤認に対する誤認訂正知識をコンピュータ上の知識として表現する事を行なった。 次に、このコンピュータ上で表現された知識を用いて、音素認識システムが出力する音素ラベルを評価する方法を構築した。具体的には、ブラックボードモデルを用いて、音素認識システムが出力した音素ラベル列を時系列として順次評価していく方法を提案した。その際、誤認に関する知識を用いる事により、各音素ラベルが信頼できるか否か、さらに、信頼度が低い場合には、どの音素が誤認された結果、この音素ラベルが出力されているのかを推論している。さらに、推論の結果として、得られた訂正後の音素ラベルを用いて文章全体として整合性が取れているかを評価し、取れていない場合には、さらに別の音素候補を前記推論を繰り返す事により獲得している。 以上のように構築した連続音声認識システムを用い、認識実験を行なう事により、本方式の性能評価を行った。
|
-
[Publications] 棚橋健二: "異常発声音の評価を目的とした音声分析表示法の予備的検討" 電子情報通信学会技術研究会資料. EA93-33. 17-23 (1993)
-
[Publications] 大内康裕: "正常および異常音声の第1・第2フォルマント平面における比較" 日本音響学会秋期研究発表会講演論文集. 593-594 (1993)
-
[Publications] 棚橋健二: "正常および異常音声のフォルマント周波数の時間遷移パターンによる比較" 日本音響学会秋期研究発表会講演論文集. 595-596 (1993)
-
[Publications] Shozo Makino: "Speech to Text Conversion System Based on Phoneme Recognition" Annals of Applied Information Science. 18. 51-65 (1993)
-
[Publications] 栗原世治: "各種音響パラメータが保持する個人性情報の分析" 日本音響学会秋期研究発表会講演論文集. 645-646 (1993)
-
[Publications] 小林淳: "動詞、名詞のスポッティングによる会話文の認識" 日本音響学会秋期研究発表会講演論文集. 175-176 (1993)