本研究は音声インターフェイスにおいて、対話のリズムが、ユーザの快適性や安全性にどれほどの影響を与えるか明らかにし、これらの要素を音声インターフェイスに導入するための新たな枠組みを提案することである。 しかし、予備的な評価実験からユーザ満足度や発話のしやすさなどの向上は確認できたが、人間同士の対話に近い感覚を与えるまでには至らなかった。この原因を調査するために人間同士の対話データを分析した結果、対話における話し手の発話タイミングは対話相手の発話特徴のみで決定できるわけではなく、話し手の発話意図(発話内容)や発話の重要度、感情などに大きく影響を受けることが示唆された。つまり、音声対話システムがリズミカルに発話するだけでは人間は機械に対して人間らしさ(安心感)を感じるわけではなく、発話意図(発話内容)や発話の重要度、感情なども考慮した適切なタイミングで発話することが人間らしさ(安心感)を感じさせるために重要である。 そこで、これらに関する対話リズムを生成するためのモデル化のさらなる改良と、音声対話システムへの実装、システム処理速度向上などを行った。 結果、これまでの音声対話システムに比べ、人間らしさ、安心感などの評価を上げることができたが、制作システムの処理速度、タイミング認識精度、音声認識・言語理解精度などの不完全さにより、人間と同等の評価まで上げることはできなかった。
|