本研究は音声インターフェイスにおいて、対話のリズムが、ユーザの快適性や安全性にどれほどの影響を与えるか明らかにし、これらの要素を音声インターフェイスに導入するための新たな枠組みを提案することである。 昨年までこの目的のために対話リズムを考慮した音声対話システムの基本システムを構築した。しかし、予備的な評価実験からユーザ満足度や発話のしやすさなどの向上は確認できたが、人間同士の対話に近い感覚を与えるまでには至らなかった。この原因を調査するために人間同士の対話データを分析した結果、対話における話し手の発話タイミングは対話相手の発話特徴のみで決定できるわけではなく、話し手の発話意図(発話内容)や発話の重要度、感情などに大きく影響を受けることが示唆された。つまり、音声対話システムがリズミカルに発話するだけでは人間は機械に対して人間らしさ(安心感)を感じるわけではなく、発話意図(発話内容)や発話の重要度、感情なども考慮した適切なタイミングで発話することが人間らしさ(安心感)を感じさせるために重要である。また、聞き手も話し手の発話タイミングの変化やずれなどから発話内容に隠された意図や感情情報を理解していると考えられる。そこで、様々な発話タイミングに変化させた多数の音声対話を被験者に聞かせ、自然性や理解しやすさなどを評価してもらったところ、発話内容に即した発話タイミングの音声対話に対してもっとも自然性や理解しやすさなどの評価が高かった。これまでの分析や仮説を裏付ける結果を得ることができた。
|