2007 Fiscal Year Annual Research Report
実ユーザの多様な発話表現に頑健なマルチドメイン音声対話システムの研究
Project/Area Number |
19700142
|
Research Institution | Kyoto University |
Principal Investigator |
駒谷 和範 Kyoto University, 情報学研究科, 助教 (40362579)
|
Keywords | 人工知能 / 自然言語処理 / 音声対話システム / 音声認識 / ラピッドプロトタイピング / ユーザモデル / 対話履歴 / WFST |
Research Abstract |
本研究の目的は,複数のドメインに対する音声対話システムにおける,ユーザの発話の多様性に対しても頑健な言語理解・対話管理の実現である.平成19年度は,以下に挙げるような各技術を開発した.これらはマルチドメイン音声対話システムにおける新たな言語理解や対話管理の基礎となる. ・対話履歴を利用した音声認識結果の頑健な解釈 音響情報や言語情報などボトムアップ情報に基づく音声認識の信頼度に加え,対話の文脈的制約をトップダウン情報としてモデル化し,音声認識結果の解釈に導入した.これにより,文脈から外れた音声認識誤りの棄却や,文脈情報を用いた発話解釈の曖昧性の解消を行う手法を開発し,評価実験により有効性を示した. ・発話検証技術の利用法の開発 ユーザ発話自体が音声対話システムにとって受理可能であるかどうかを判別する手法を開発した.もしユーザ発話がシステムの受理可能な範囲外である場合,音声認識は必ず誤りを含み,かつその場合ユーザに単純に再発話を要求しても意味がない.そこで,発話検証技術を適用し,複数のデコーダによる音響尤度を比較することで,ユーザの発話が文法に沿っているかを推定する方法を開発した.評価実験をユーザの自由な発話に対して行い,有効性が示されたが,短い発話に対しては文法内外の判定を誤る場合が多く,この点に関する改善の必要性も明らかになった.
|
Research Products
(12 results)