Project/Area Number |
25H01142
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Medium-sized Section 61:Human informatics and related fields
|
Research Institution | Kyoto University |
Principal Investigator |
河原 達也 京都大学, 情報学研究科, 教授 (00234104)
|
Co-Investigator(Kenkyū-buntansha) |
井上 昂治 京都大学, 情報学研究科, 助教 (10838684)
井本 桂右 京都大学, 情報学研究科, 准教授 (90802116)
熊田 孝恒 京都大学, 情報学研究科, 教授 (70221942)
吉井 和佳 京都大学, 工学研究科, 教授 (20510001)
|
Project Period (FY) |
2025-04-01 – 2029-03-31
|
Project Status |
Granted (Fiscal Year 2025)
|
Budget Amount *help |
¥45,630,000 (Direct Cost: ¥35,100,000、Indirect Cost: ¥10,530,000)
Fiscal Year 2025: ¥11,050,000 (Direct Cost: ¥8,500,000、Indirect Cost: ¥2,550,000)
|
Keywords | 音声認識 / 音声対話 / 多人数会話 |
Outline of Research at the Start |
従来の音声認識・対話システムは、原則としてユーザが1人、すなわち1人の話者がシステムに話すことが大前提となっている。これに対して本研究では、複数人がいる会話に参与することを目指して、音声認識と音声対話の両面からモデル化及びシステム実装を行う。具体的には、(1)音声分離・発話者検出(誰が話しているのか)、(2)発話権認識(次に誰が話すのか)、(3)聞き手反応の生成(発話権がない時にどう反応するか)、(4)感情・雰囲気の認識に基づく対話生成、の課題に取り組む。ロボット・AIが、複数人がいる状況で、基本的なコミュニケーション能力及び社会性を身に着けることができるかという問いに答えるものである。
|