研究課題/領域番号 |
18K19811
|
研究機関 | 名古屋大学 |
研究代表者 |
松原 茂樹 名古屋大学, 情報連携推進本部, 教授 (20303589)
|
研究分担者 |
大野 誠寛 東京電機大学, 未来科学部, 准教授 (20402472)
村田 匡輝 豊田工業高等専門学校, 情報工学科, 准教授 (30707807)
|
研究期間 (年度) |
2018-06-29 – 2022-03-31
|
キーワード | 音声言語処理 / 会話システム / コーパス / 応答生成 / 談話理解 |
研究実績の概要 |
語ることは人間に備わる基本的な欲求である。スマートスピーカーなどの情報機器が語りを聴く役割を担うことで、語りのある生活が身近になると考えられる。本研究は、話し手の語りに対して共感的応答を生成することの実現性を示すことを目的とする。 今年度は、共感を示す応答データの拡大、及び、応答の表出されやすさの推定方式の開発に取り組んだ。 共感を示す応答データの拡充では、昨年度までの作業者5名分のデータに対し、さらに作業者5名分の応答音声を収集し、計10名分の共感応答データとして整備した。これまでの合計で131,616個の応答が含まれている。なお、応答データの収集には、作業者が録音された語りを聞きながら応答することで収集している。録音された語りとして,30名の高齢者による合計約8時間40分の音声を使用している。収集した応答にはすべて、書き起こし、形態素情報、発話時間情報が付与されている。 応答の表出されやすさの推定方式の開発では、適切なタイミングでの傾聴応答の表出は,話し手の語る意欲を促進する効果が期待できるものの、不適切なタイミングでの表出は逆効果になりうるという表出タイミングの重要性に着目して取り組んだ。具体的には、あるタイミングが傾聴応答の生成にどの程度適するかを推定する手法を実現した。適切さを表す指標として傾聴応答の表出率、すなわち、あるタイミングでの傾聴応答の表出率を、そのタイミングで傾聴応答を表出した聞き手の割合として定義した。本手法では、語りの音響情報とテキスト情報を用いて、傾聴応答の表出率を予測する。両情報をtransformerベースの手法でエンコードし,エンコード結果を1次元に変換して表出率を算出する。表出率の予測実験を行ったところ,語りの音響情報とテキスト情報の両方を予測に使用する提案手法が有効であることを確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究プロジェクトでは、共感応答のコーパス整備、共感応答の体系化、及び、応答生成タイミングの検出技術の開発を計画していたのに対し、これまで、大規模な共感応答データの収集とコーパス化、共感度に基づく応答の分類、及び、共感応答の表出されやすさを推定する方式の実現などの成果を産み出すことができた。これらを論文としてまとめ、国内学会で公表したのに加え、国際会議に投稿するに至っており、本課題はおおむね順調に進展しているといえる。
|
今後の研究の推進方策 |
次年度は、本研究プロジェクトのまとめとして、昨年度までに開発した共感応答タイミングの検出技術を多角的に評価することが目標となる。評価では、これまでに収集したコーパスに正解データを付与し、それを使用する。また、評価結果をまとめた成果を国内外の会議で発表する。このために、評価データ作成の委託費、及び、成果発表旅費を計上している。現状において、研究遂行上の重要な問題は発生していない。現行の計画内容の大きく変更は要しない。
|
次年度使用額が生じた理由 |
今年度、応答タイミングを検出する技術を開発し、その成果を国際会議等で公表することを計画していた。しかし、応答の表出されやすさという多角性に対し、当初想定していた評価の観点は十分でなく、複合的な評価技法の設計が必要であることが判明した。複合評価のための評価データを作成し、それを用いた成果を国際会議ならびに学術誌で公表する予定であり、本助成金をこれらに使用する計画である。
|