1997 Fiscal Year Annual Research Report
キーフレーズ認識とその信頼度計算に基づく柔軟な音声対話理解
Project/Area Number |
09780328
|
Research Institution | Kyoto University |
Principal Investigator |
河原 達也 京都大学, 大学院・工学研究科, 助教授 (00234104)
|
Keywords | 音声認識 / 音声理解 / 単語スポッティング / 発話検証 / キーフレーズ |
Research Abstract |
対話環境における柔軟な音声理解を実現するために,キーフレーズの検出と検証の組合せに基づくアプローチを研究した。キーフレーズには意味タグが付与されており、その検出が直接的に頑健な理解を実現する。検出の湧き出し誤りを抑制するために、サブワードベースの発話検証手法を導入する。これは、認識結果に信頼度を付与するものである。信頼度を定義するいくつかの関数について比較・検討を行った。複数の音声対話タスクのフィールドデータに適用した結果、本手法が、(1)定型的な発話に対して精度を維持した上で、(2)非定型な発話に対する理解率を向上し、(3)タスク外発話の棄却率も改善することが示された。 さらに、頑健なキーフレーズの検出・検証のために、タスクに独立なフィラーモデルの構成法について研究した。本モデルは、タスク固有の語彙を前提とするかわりに、会話のスタイルに依存したフレーズを抽出するものであり、類似の異なった(大規模)コーパスから学習することが可能である。情報検索対話スタイル依存モデルをATISコーパスを用いて学習し、異なった情報検索タスクの音声理解におけるフィラーモデルとして利用することで、認識精度が向上することを示した。
|
Research Products
(6 results)
-
[Publications] T.Kawahara: "Flexible speech understanding based on combined key-phrase detection and verification" IEEE Trans.Speech & Audio Processing. 採録決定. (1998)
-
[Publications] T.Kawahara: "Phrase language models for detection and verification-based speech understanding" Proc.IEEE Workshop on Automatic Speech Recognitoin. 49-56 (1997)
-
[Publications] T.Kawahara: "Combining key-phrase detection and subword-based verification for flexible speech understanding" Proc.IEEE Int'l Conf.Acoust.,Speech & Signal Processing. 1. 1159-1162 (1997)
-
[Publications] H.Masataki: "Task adaptation using MAP estimation in n-gram language modeling" Proc.IEEE Int'l Conf.Acoust.,Speech & Signal Processing. 1. 783-786 (1997)
-
[Publications] C-H.Jo: "Japanese pronunciation training system with HMM segmentation and distinctive feature classification" Proc.Int'l Conf.on Speech Processing. 341-346 (1997)
-
[Publications] T.Kawahara: "Speaking-Style dependent lexicalized filler model for key-phrase detection and verification" 電子情報通信学会技術研究報告. SP97-78. (1997)