研究課題/領域番号 |
20K19821
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 京都大学 |
研究代表者 |
井上 昂治 京都大学, 情報学研究科, 助教 (10838684)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 音声対話システム / 会話ロボット / ターンテイキング / 発話権取得 / 話者交替 / 対話 / 意図理解 / 多人数対話 / 笑い / 言語理解 / 応答生成 / 対話理解 |
研究開始時の研究の概要 |
音声対話システムにおいてユーザの発話終了を検出するターンテイキング予測は、円滑な対話を実現するための重要な機能である。従来のターンテイキングの予測モデルは先行するユーザ発話の情報のみを扱っていたが、人間どうしの会話ではより多面的な情報が考慮されているといえる。そこで、従来の音声対話システムでは独立に動作していた対話理解と発話生成のモジュールに関して、これらの動作と連動してターンテイキングを予測するシステムを提案する。さらに、これら複数のモジュールのモデルを同時に学習する統合的なモデルの構築にも取り組む。また、提案する予測モデルを音声対話システムへ搭載して、被験者実験によりその有用性を確認する。
|
研究成果の概要 |
音声対話システムにおけるターンテイキング(発話権取得)の新たなモデルを実現した。人間どうしのターンテイキングに倣い、対話データセット中の各発話の「意図」と「内容」が理解可能か否かをアノテーションした。そして、はじめに「意図」または「内容」が理解可能かを判定し、その結果に基づいて発話権を取得するか否かを判定する2段階のターンテイキング予測モデルを構築した。加えて、音声対話システムの基礎的な機能として、同調笑いの生成についても取り組んだ。笑いの検出、同調笑いの予測、笑いの種類の選択という3つのモデルで構成されるシステムを提案し、その有効性を確認した。
|
研究成果の学術的意義や社会的意義 |
音声対話システムは、会話ロボットやスマートスピーカに展開されている。しかし、これらのシステムによるやりとりは機械的であると言わざるを得ない。その要因の一つとしてターンテイキングが挙げられる。現在のシステムでは、発話権を取得するに際して、不自然に長い間や割り込みが生じることが多く、これにより対話の円滑さを低下させている。その一方で、人間どうしの対話では、特に意識することなく、円滑なターンテイキングが実現されている。本研究により、人間どうしのターンテイキングのメカニズムの解明に向けて、構成論的な一つのアプローチを示すことができた。
|