研究概要 |
音声認識に基づくインタフェースでは,音声認識の誤認識は避けがたい.しかし認識結果が正しいか否かをユーザに確認を求めるステップは非常にわずらわしい.そこで音声対話におけるシステムの誤認識を,対話を通じて自然かつ効率的に暗黙に回復する対話戦略を研究している.自然かつ効率的に誤認識を回復するために,確認発話を多用しない対話戦略として,各対話ターンにおいて複数の理解候補を保持し,対話を通して最適な仮説を探索する.その際,理解候補を収束させる効率性の尺度と,理解候補と矛盾しない無矛盾性の尺度をシステム応答の選択に用いる.無矛盾性尺度は,ユーザのこれまでの入力内容にできるだけ矛盾しない応答であること,効率性尺度は,複数の認識・理解を保持することによる曖昧さを効率よく解消する応答であること,を評価する尺度である.これらを数値表現する方法を考案し,カーナビ対話をタスクとして計算機シミュレーションによる客観評価およびシミュレーションで生成した対話の人間による聴取に基づく主観評価を行い,自然で効率的な戦略であることを示した.さらに,これらの手法を用いた音声対話システムを構築し,実際に被験者が使用して客観的・主観的に評価を行いよい結果を得た.しかしまだ対話の流れに不自然さを感じることが明らかとなった.この方法がさまざまなタスクで効果があることを示すために,対話による楽曲の推薦システムの構築を開始し,さらに対話の流れを自然にするための尺度(自然性尺度)の導入を開始した.
|