話者の意図・概念・感情を理解し、応答するためのモデルの研究である。音声から理解を経て相槌を生成する系と、理解の要素を定義し理解の程度を認識して応答を返す系を構築することを目的としている。これらはドメインを限定しないリアルタイムなものを目指している。感情を扱うために音声の書き起こしを行わないEnd-to-Endモデルで行う。 従来、認知科学的手法によって行われてきた研究テーマに対して、機械学習で挑戦しようとする新しいアプローチの研究である。この研究によって、感情・共感や音声理解のモデル化が可能となり、それらの理解が進むと期待される。また、ロボットによる対話システムの実装まで視野に入れており、カウンセリングなど実社会への応用も期待される。
|