一般に、音声対話中ではシステムによる誤認識が生じる。誤認識からの回復のために、確認発話があるが、一般に対話ターン数が多くなる。確認発話を行わなければ、対話ターン数は大幅な削減が期待できが、誤認識したまま対話が進行し、対話中にこれまでの理解と現在のユーザ発話において矛盾が起こり対話が破綻したり、最終的に誤った理解結果に至る。これは、音声認識の結果の第一候補のみを信じて対話を進めることに起因する。各認識において、複数得られる認識候補を有効に用いれば、この危険は低減される。 そこで認識の複数候補に基づいたユーザ発話の理解候補を複数持ち、「あいまいな」理解状態のまま対話を進行する手法を提案した。複数の理解候補には音声認識に基づく信頼度が付与され、システムはユーザ発話の度に、ユーザ発話の複数認識候補と現在の各理解候補を組み合わせることで最新の理解候補を構成する。 この場合、理解候補は対話を繰り返すことで増加していく。そこで、現在の理解候補中から正しいであろう候補を絞り込める可能性が高く(効率性)、かつユーザにとって自然な応答である可能性の高い(自然性)、複数候補の理解にできるだけ共通するシステムの応答を選択する応答基準を対案した。 また、ユーザはシステムの誤認識に対して、同じ内容の繰り返しで訂正しようとするという傾向を利用し、これまでに提案した言い直し発話検出を用い、対話中での誤認識を検出し、上記の理解候補の信頼度を操作することにより、より効率的に候補を絞り理解を進める手法も提案した。 最終的に提案手法を備えた音声対話システムを構築し、実際の対話例において本手法の有効性が見られる対話例を得ることが出来た。
|