2022 年度研究成果報告書

対話理解および発話生成と連動するターンテイキングシステム

研究課題

PDF

研究課題/領域番号	20K19821
研究種目	若手研究
配分区分	基金
審査区分	小区分61010:知覚情報処理関連
研究機関	京都大学
研究代表者	井上昂治京都大学, 情報学研究科, 助教 (10838684)
研究期間 (年度)	2020-04-01 – 2023-03-31
キーワード	音声対話システム / 会話ロボット / ターンテイキング / 発話権取得 / 話者交替
研究成果の概要	音声対話システムにおけるターンテイキング（発話権取得）の新たなモデルを実現した。人間どうしのターンテイキングに倣い、対話データセット中の各発話の「意図」と「内容」が理解可能か否かをアノテーションした。そして、はじめに「意図」または「内容」が理解可能かを判定し、その結果に基づいて発話権を取得するか否かを判定する２段階のターンテイキング予測モデルを構築した。加えて、音声対話システムの基礎的な機能として、同調笑いの生成についても取り組んだ。笑いの検出、同調笑いの予測、笑いの種類の選択という３つのモデルで構成されるシステムを提案し、その有効性を確認した。
自由記述の分野	音声対話システム
研究成果の学術的意義や社会的意義	音声対話システムは、会話ロボットやスマートスピーカに展開されている。しかし、これらのシステムによるやりとりは機械的であると言わざるを得ない。その要因の一つとしてターンテイキングが挙げられる。現在のシステムでは、発話権を取得するに際して、不自然に長い間や割り込みが生じることが多く、これにより対話の円滑さを低下させている。その一方で、人間どうしの対話では、特に意識することなく、円滑なターンテイキングが実現されている。本研究により、人間どうしのターンテイキングのメカニズムの解明に向けて、構成論的な一つのアプローチを示すことができた。