(1)対話リズムを重視したタスク指向型音声対話システムの開発 これまで構築・改良した、音声認識部、言語理解部、応答生成部、対話リズム生成部を統合し、本大学の建物案内用音声対話システムを構築した。 (2)意図理解システムの精度向上のための改良 対話のリズムを重視するために必要なポーズ単位の音声言語理解システムを改良した。これは、自立語、動詞などのキーワードと助詞などの付属語のそれぞれの音声認識信頼度と、対話履歴を利用し、ユーザの発話する可能性がある発話意図ごとに意図スコアを計算し、最も高いスコアの発話意図がユーザの発話した意図であると仮定する音声言語理解システムである。意図スコアの値は確信度として利用でき、ユーザ満足度の高い対話制御を行うために利用される。より精度を高めるために、全体のアルゴリズムを見直すことを行った。 (3)ロボットを用いた身体性の重要性の分析 実際のロボットを用いて、音声対話システムにおける身体性の重要性の実験を行った。特に、発話タイミングとジェスチャのタイミングの自然性、相手の発話中のジェスチャの自然性に注目し、実験を行った。実験の結果、タスク指向型の音声対話システムにおいては、音声認識、言語理解性能がある一定以上の精度がない場合、そちらの方の不自然さに注目が集まり、身体性の自然さなどに意識が行かないことがわかった。また、ジェスチャの使い方により、ユーザの発話をある程度制御できる可能性を得た。 (4)対話制御に関する嗜好性の分析 音声対話におけるユーザの対話相手に関する嗜好を分析するために、擬似音声対話システムを開発し、被験者を用いた被験者実験を行った。実験から対話相手の対話制御に関する嗜好が存在すること。その嗜好により、印象が大きく変化することなどがわかった。 (5)タスク指向対話における発話意図と対話リズムの関係の分析 これまでの対話リズム生成部のアルゴリズムは、音響的特長と音声認識結果中のキーワードだけを用いたものとなっていた。しかしながら、実際の発話タイミング、F0、話速などは、発話内容にも依存していると考えられる。そこで、より自然な対話リズムの生成には、発話意図を考慮した対話リズム制御が必要であると思われる。そこで、本タスクに関する様々な状況の自然な音声対話を大量に収集し、発話意図や対話構造によって、ユーザ発話の言語的・音響的特徴や対話リズム、同調作用がどのように変化するか分析し、様々な知見を得た。
|