2016 Fiscal Year Annual Research Report

A spoken dialogue system based on estimation of mental state using multimodal processing

Research Project

Project/Area Number	15J07337
Research Institution	Kyoto University
Principal Investigator	井上昂治京都大学, 情報学研究科, 特別研究員(DC1)
Project Period (FY)	2015-04-24 – 2018-03-31
Keywords	対話システム / エンゲージメント / マルチモーダル / 心的状態
Outline of Annual Research Achievements	人間どうしの自然な対話における多様なふるまいから、対話に対する興味や意欲を表すエンゲージメントの度合いを推定するモデルを構築した。エンゲージメントを推定することで、対話相手（ユーザ）の状態を理解するだけでなく、システムの適応的な行動やふるまいの実現が期待される。エンゲージメントの推定は客観的であり、推定する人に依存するため、高い精度での推定は困難であるといえる。そこで、エンゲージメントの度合いを推定する人のキャラクタ（性格）を潜在変数とする階層ベイズモデルを提案した。これにより、キャラクタを表す潜在変数の分布をデータから自動で学習しながら、同時にエンゲージメントの推定自体も学習することができるようになった。予備収録した対話データを用いて提案モデルを評価したところ、キャラクタを考慮しない場合に比べて、推定精度が向上することを確認した。また、複数のマイクロホンやカメラなどのマルチモーダルセンサを用いて、対話データ91セッションを収録した。このデータに対して、発話、ふるまい、エンゲージメントに関するデータを整備した。エンゲージメントは、複数の被験者に判断してもらい、上記の提案モデルの評価が行えるようにした。さらに、エンゲージメントの推定機能を実用化するための対話エージェントを想定して、自律型アンドロイドＥＲＩＣＡのための対話システム、および音声認識の研究開発を行った。対話システムに関しては、マイクロホンやカメラなどから得られる多様なセンサ信号を統合し、同時にアンドロイド自身が多様なふるまいを生成することで、ユーザとのマルチモーダルインタラクションを実現した。また、本システムのデモンストレーション発表を行った。音声認識に関しては、マイクロホンアレイによるハンズフリー処理を指向し、デノイジングオートエンコーダを用いることで実時間かつ頑健な処理を実現した。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 自律型アンドロイドによる自然な音声対話に関する研究に取り組んでおり、対話データを収録する環境を構築して、91名との対話を収録した。これを用いて、相槌やうなずきなどのマルチモーダルなふるまいとエンゲージメントレベル（心的状態）との関係を分析し、前者から後者を推定する統計的モデルを構築できたため。また、研究室ガイドや傾聴を行うシステムを構築し、複数の国際会議などでデモ発表を行ったため。
Strategy for Future Research Activity	本年度に収録した対話データを用いて、エンゲージメント推定モデルの評価をより大規模に行う。また、エンゲージメント推定モデルを実時間で動作させ、上記の自律型アンドロイドＥＲＩＣＡの対話システムへ組み込む。これにより、実ユーザとのインタラクションにおいて、エンゲージメント推定モデルの有効性を検証する。さらに、エンゲージメントを推定したのちの、対話エージェントの行動やふるまいについて、対話データを用いた分析、およびふるまいの予測モデルの構築と検証を行う。

Research Products

(7 results)

All 2017 2016

All Presentation (7 results) (of which Int'l Joint Research: 3 results)

[Presentation] 聞き手の多様なふるまいに基づく対話エンゲージメントの推定2017
- Author(s)
  井上昂治, Lala Divesh, 高梨克也, 河原達也
- Organizer
  日本音響学会 2017年春季研究発表会
- Place of Presentation
  明治大学(神奈川県・川崎市)
- Year and Date
  2017-03-17 – 2017-03-17
[Presentation] DAEを用いたリアルタイム遠隔音声認識2017
- Author(s)
  井上昂治, 三村正人, 石井カルロス寿憲, 坂井信輔, 河原達也
- Organizer
  日本音響学会 2017年春季研究発表会
- Place of Presentation
  明治大学(神奈川県・川崎市)
- Year and Date
  2017-03-15 – 2017-03-15
[Presentation] Annotation and analysis of listener's engagement based on multi-modal behaviors2016
- Author(s)
  Koji Inoue, Divesh Lala, Katsuya Takanashi, Tatsuya Kawahara
- Organizer
  ICMI 2016 workshop on Multimodal Analyses enabling Artificial Agents in Human-Machine Interaction
- Place of Presentation
  タイム24ビル(東京都・江東区)
- Year and Date
  2016-11-16 – 2016-11-16
- Int'l Joint Research
[Presentation] Multimodal interaction with the autonomous android ERICA2016
- Author(s)
  Divesh Lala, Pierrick Milhorat, Koji Inoue, Tianyu Zhao, Tatsuya Kawahara
- Organizer
  ICMI 2016
- Place of Presentation
  日本科学未来館(東京都・江東区)
- Year and Date
  2016-11-14 – 2016-11-14
- Int'l Joint Research
[Presentation] 階層ベイズモデルを用いた聞き手の多様なふるまいに基づく対話エンゲージメントの推定2016
- Author(s)
  井上昂治, Lala Divesh, 高梨克也, 河原達也
- Organizer
  人工知能学会言語・音声理解と対話処理研究会
- Place of Presentation
  早稲田大学(東京都・新宿区)
- Year and Date
  2016-10-06 – 2016-10-06
[Presentation] 自律型アンドロイドERICAによる社会的役割に則したインタラクション2016
- Author(s)
  井上昂治, Milhorat Pierrick, Lala Divesh, 趙天雨, 河原達也
- Organizer
  人工知能学会言語・音声理解と対話処理研究会
- Place of Presentation
  早稲田大学（東京都・新宿区）
- Year and Date
  2016-10-05 – 2016-10-05
[Presentation] Talking with ERICA, an autonomous android2016
- Author(s)
  Koji Inoue, Pierrick Milhorat, Divesh Lala, Tianyu Zhao, Tatsuya Kawahara
- Organizer
  SIGDIAL 2016
- Place of Presentation
  Los Angeles(The United States of America)
- Year and Date
  2016-09-14 – 2016-09-14
- Int'l Joint Research

2016 Fiscal Year Annual Research Report

A spoken dialogue system based on estimation of mental state using multimodal processing

Principal Investigator

井上 昂治 京都大学, 情報学研究科, 特別研究員(DC1)

Current Status of Research Progress

Reason

Research Products

[Presentation] 聞き手の多様なふるまいに基づく対話エンゲージメントの推定2017

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] DAEを用いたリアルタイム遠隔音声認識2017

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Annotation and analysis of listener's engagement based on multi-modal behaviors2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Multimodal interaction with the autonomous android ERICA2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 階層ベイズモデルを用いた聞き手の多様なふるまいに基づく対話エンゲージメントの推定2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 自律型アンドロイドERICAによる社会的役割に則したインタラクション2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Talking with ERICA, an autonomous android2016

Author(s)

Organizer

Place of Presentation

Year and Date

井上昂治京都大学, 情報学研究科, 特別研究員(DC1)