2017 Fiscal Year Annual Research Report
Towards autonomous synthesis of empathetic speech for a information system to obtain users' confidence
Project/Area Number |
15K00272
|
Research Institution | Tsuyama National College of Technology |
Principal Investigator |
川波 弘道 津山工業高等専門学校, 総合理工学科, 特命准教授 (80335489)
|
Co-Investigator(Kenkyū-buntansha) |
神原 誠之 奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (10346306)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | ヒューマンインタフェイス / 音声対話 |
Outline of Annual Research Achievements |
本研究では高齢者や情報システムに不慣れなユーザがストレスを感じることなく情報システムを使用できるような、ユーザの心理的障壁を軽減する音声インタフェイスの研究を行った。この技術はデジタルデバイド問題の解消だけでなく、発話機会が減少する独居高齢者の発話支援にも利用できる。具体的には、ユーザへの「同調」の観点で研究を行い、音声対話システムの応答音声をユーザが信頼感を感じられる声質、タイミング、発話内容にすることを目指した。 2年目までにユーザ発話の抑揚に合わせた韻律制御(コピーイング)と適切なタイミングで相槌や復唱(バックトラッキング)を行うプログラムを作成した。また、実証実験環境として、ユーザがテレビ番組を見ているときに、対話エージェントとの対話を通してSNSからの情報も交えて雑談を行える雑談ロボットを開発した。 最終年度の3年目は、主にユーザが対話システムとより積極的に対話できるようにシステムの改良を行い、評価実験を行った。視聴しているテレビ番組とSNS情報に基づく応答音声を同期させるための「追いかけ再生」や、エージェントの多重化についての検討も行った。 本課題での主な成果は、ユーザへの同調を意図した効果的な相槌、復唱、応答音声のタイミング制御を行うシステムの開発である。このシステムの特長に注目して研究を進めることが有効と判断したため、当初計画で予定していた、ユーザの語彙に合わせた単語選択と周波数特性の話者性を模擬した同調音声の合成は予備的調査に留めることとなった。今後はそれらの有効性を調査したい。
|