音声対話システムを利用する際に音声認識システムが誤認識を起こすことは避けがたく、それを受け入れたうえでいかにシステムが対話をうまくコントロールするかという対話制御が重要となる。 常に確認したり、信頼性の低い入力に対して確認したりする対話は、確実な対話の進行にはよいが、発話回数を増大させて効率が低下し、ユーザに負担をかける。本研究では、ユーザの誤りの可能性を考慮して複数の理解結果をグラフの各ノードとして保持する手法を提案し、理解の進行は入力発話ごとのグラフ展開とみなすことで、まず曖昧理解表現を可能にした。最終的な対話の目的は、グラフ状の正解ノードに探索の末にたどり着くことである。 これまでにスロットフィリング型理解を、本探索木上のヒューリスティック探索として解く方法を提案し、またヒューリスティックスに曖昧さ解消の速さ(効率性)とユーザの発話への矛盾の少なさ(無矛盾性)を用いることで、自然で効率的に解に到達できることを示した。そして今年度はこの手法を実際の対話システムとして実装し、PC上で音楽が検索できるシステムを構築した。 また、それと並行して、常時人間同士の対話を聞き続け、その中から音楽に関するキーワードを抽出するキーワードスポッティングを行うことによって、直接システムと対話をしない場合においても音楽検索に有用な情報を獲得し、上記の探索木上のノード展開を進め、その場の話題の関連楽曲を探し出してかけることのできるシステムへと発展させた。 また、本研究の副産物として、こうした対話システムのユーザ満足度を、主観評価なしに計測する手法も提案した。
|