研究課題/領域番号 |
19K04311
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分20020:ロボティクスおよび知能機械システム関連
|
研究機関 | 徳島大学 |
研究代表者 |
西村 良太 徳島大学, 大学院社会産業理工学研究部(理工学域), 講師 (50635878)
|
研究分担者 |
山本 一公 中部大学, 工学部, 教授 (40324230)
西崎 博光 山梨大学, 大学院総合研究部, 教授 (40362082)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2020年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2019年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 音声対話システム / タイミング / テンポ / 音声言語情報処理 / 深層学習 / 音声認識 / リアルタイム制御 / ROS / 対話テンポ / 自然な対話 |
研究開始時の研究の概要 |
本研究は,これからの進んだ人工知能,ロボット,IoTの広く普及する社会で,人間とシステムがより円滑にコミュニケーションを図るために必須となる,対話のテンポの改善を目指すものである.このために,本研究ではテンポの制御が可能な音声対話システムを設計・構築し,テンポ制御モデルを構築する.人間同士の対話を正解データとして用い,機械学習によりテンポ生成モデルを構築し,これを音声対話システムに導入する.これまでに,円滑な対話を実現したシステムは前例が無く,研究としても意義がある. 本研究の成果によって,ストレスのない対話が可能な音声対話システムを,既存ロボットシステムなどに簡単に導入することが可能となる.
|
研究成果の概要 |
本研究では,「リアルタイム制御可能な音声対話システムの構築」を行った.本システムはROSのアーキテクチャを採用しており,システム開発時の通信管理やデバッグを効率的に行えるようにした. またこのシステム内で用いるための応答タイミング制御モジュールである「相槌タイミング制御モジュール」の構築を行った.リアルタイム動作を実現させるために,単純な音響的情報のみを用いている.モデル構成も単純なLSTMのモデルとした.このモデルで,相槌タイミングをF値0.933という高精度で生成することが可能である. また,これらについてオープンソースとしてgithubで公開し,広く一般に利用可能とした.
|
研究成果の学術的意義や社会的意義 |
最近のChatGPTなどの大規模言語モデルの高精度化に伴い,音声対話システムに対しても,より高精度で自然な対話が期待され始めた.そして,自然に対話を行うためには対話のテンポが非常に重要であるものの,これまでの音声対話システムでは,設計上の問題で実現不可能であった. 本研究の成果により,この問題が解決され,リアルタイムに制御が可能な音声対話システムを開発・動作させることが可能となる.高速に動作可能な相槌応答タイミング生成モデルも構築し,本システムに搭載したことから,音声対話システム開発者は,応答内容やその他の部分に注力してシステム開発することで,自然な音声対話システムを実現できる.
|