Research Project
Grant-in-Aid for Young Scientists (B)
音声対話システムを利用する際には、システムは誤認識を起こす。誤認識したまま対話を継続して対話が破綻しないようにするためには誤認識を回復することが必要となるが、そのために、一般には確認発話を用いる。しかしこれは、対話の発話(ターン)数を増加し、効率の悪い対話となる。確認発話を行わない対話が破綻したり、最終的に誤った理解結果に至るのは、音声認識の結果の第一候補のみを信じて対話を進めるためである。各認識において、複数得られる認識候補を有効に用いれば、この危険は低減される。そこで、ユーザ発話の音声認識した結果得られる複数候補を利用し、各ターンごとにユーザ発話の理解候補を複数持つ、「あいまいな」理解状態表現を用い、この理解に基づいて対話を進めることのできる対話システムを開発した。複数の理解候補は、音声認識結果の信頼度によってスコア付けして保持され、この理解候補全体で理解状態を表現する。そして、ユーザの発話が認識され、あらたな複数認識候補が得られると、それらとの組み合わせによって新たな理解候補が複数生成され、理解状態が更新される。この過程で理解候補は組み合わせて的に増加していくため、スコアによる、いわゆる枝狩りによって上位候補に絞り込みながら対話を進める。その際、ユーザはシステム応答に応じた発話をするので、システムがいかに適切な応答をすることができるかは重要になる。そこで、現在の理解候補中からできるだけ正しいと考えられる候補に絞り込め(効率性)、かつ、その応答が対話履歴と照らした際にユーザにとって矛盾に感じる可能性が低い(無矛盾性)応答を選択する基準を対案した。この対話基準を、音声対話シミュレーション(擬似的な音声認識結果を生成する擬似認識器による擬似ユーザを用いた対話)により評価した結果、従来の、毎回確認する方法や、認識結果の信頼度が低い場合にのみ確認する方法と比較して少ないターン数で対話を完了できることを確認した。
All 2006 2005 2004
All Journal Article (5 results)
Proceedings of IEEE 2006 Workshop on Spoken Language Technology
Pages: 202-205
情報処理学会研究報告 2006-SLP-61-7
Pages: 37-42
110004849721
言語処理学会第12回年次大会講演論文集
Proceedings of 10th International Conference Speech and Computer
Pages: 199-204
電子情報通信学会論文誌(D-II) Vol.J87-D-II No.7
Pages: 1441-1450