複数人会話に参与するロボットのための音声認識・対話システム

研究課題

研究課題/領域番号	25H01142
研究種目	基盤研究(A)
配分区分	補助金
応募区分	一般
審査区分	中区分61:人間情報学およびその関連分野
研究機関	京都大学
研究代表者	河原達也京都大学, 情報学研究科, 教授 (00234104)
研究分担者	井上昂治京都大学, 情報学研究科, 助教 (10838684) 井本桂右京都大学, 情報学研究科, 准教授 (90802116) 熊田孝恒京都大学, 情報学研究科, 教授 (70221942) 吉井和佳京都大学, 工学研究科, 教授 (20510001)
研究期間 (年度)	2025-04-01 – 2029-03-31
研究課題ステータス	交付 (2025年度)
配分額 *注記	45,630千円 (直接経費: 35,100千円、間接経費: 10,530千円) 2025年度: 11,050千円 (直接経費: 8,500千円、間接経費: 2,550千円)
キーワード	音声認識 / 音声対話 / 多人数会話
研究開始時の研究の概要	従来の音声認識・対話システムは、原則としてユーザが１人、すなわち１人の話者がシステムに話すことが大前提となっている。これに対して本研究では、複数人がいる会話に参与することを目指して、音声認識と音声対話の両面からモデル化及びシステム実装を行う。具体的には、(1)音声分離・発話者検出（誰が話しているのか）、(2)発話権認識（次に誰が話すのか）、(3)聞き手反応の生成（発話権がない時にどう反応するか）、(4)感情・雰囲気の認識に基づく対話生成、の課題に取り組む。ロボット・ＡＩが、複数人がいる状況で、基本的なコミュニケーション能力及び社会性を身に着けることができるかという問いに答えるものである。

報告書

(1件)

2025 審査結果の所見