研究課題/領域番号 |
20K19821
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 京都大学 |
研究代表者 |
井上 昂治 京都大学, 情報学研究科, 助教 (10838684)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 音声対話システム / 会話ロボット / ターンテイキング / 発話権取得 / 話者交替 |
研究成果の概要 |
音声対話システムにおけるターンテイキング(発話権取得)の新たなモデルを実現した。人間どうしのターンテイキングに倣い、対話データセット中の各発話の「意図」と「内容」が理解可能か否かをアノテーションした。そして、はじめに「意図」または「内容」が理解可能かを判定し、その結果に基づいて発話権を取得するか否かを判定する2段階のターンテイキング予測モデルを構築した。加えて、音声対話システムの基礎的な機能として、同調笑いの生成についても取り組んだ。笑いの検出、同調笑いの予測、笑いの種類の選択という3つのモデルで構成されるシステムを提案し、その有効性を確認した。
|
自由記述の分野 |
音声対話システム
|
研究成果の学術的意義や社会的意義 |
音声対話システムは、会話ロボットやスマートスピーカに展開されている。しかし、これらのシステムによるやりとりは機械的であると言わざるを得ない。その要因の一つとしてターンテイキングが挙げられる。現在のシステムでは、発話権を取得するに際して、不自然に長い間や割り込みが生じることが多く、これにより対話の円滑さを低下させている。その一方で、人間どうしの対話では、特に意識することなく、円滑なターンテイキングが実現されている。本研究により、人間どうしのターンテイキングのメカニズムの解明に向けて、構成論的な一つのアプローチを示すことができた。
|