研究課題/領域番号 |
25H01142
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
中区分61:人間情報学およびその関連分野
|
研究機関 | 京都大学 |
研究代表者 |
河原 達也 京都大学, 情報学研究科, 教授 (00234104)
|
研究分担者 |
井上 昂治 京都大学, 情報学研究科, 助教 (10838684)
井本 桂右 京都大学, 情報学研究科, 准教授 (90802116)
熊田 孝恒 京都大学, 情報学研究科, 教授 (70221942)
吉井 和佳 京都大学, 工学研究科, 教授 (20510001)
|
研究期間 (年度) |
2025-04-01 – 2029-03-31
|
研究課題ステータス |
交付 (2025年度)
|
配分額 *注記 |
45,630千円 (直接経費: 35,100千円、間接経費: 10,530千円)
2025年度: 11,050千円 (直接経費: 8,500千円、間接経費: 2,550千円)
|
キーワード | 音声認識 / 音声対話 / 多人数会話 |
研究開始時の研究の概要 |
従来の音声認識・対話システムは、原則としてユーザが1人、すなわち1人の話者がシステムに話すことが大前提となっている。これに対して本研究では、複数人がいる会話に参与することを目指して、音声認識と音声対話の両面からモデル化及びシステム実装を行う。具体的には、(1)音声分離・発話者検出(誰が話しているのか)、(2)発話権認識(次に誰が話すのか)、(3)聞き手反応の生成(発話権がない時にどう反応するか)、(4)感情・雰囲気の認識に基づく対話生成、の課題に取り組む。ロボット・AIが、複数人がいる状況で、基本的なコミュニケーション能力及び社会性を身に着けることができるかという問いに答えるものである。
|