研究実績の概要 |
当該年度は,インタビュー対話コーパスを構築するためにTVの対談番組から388対話(放送1回分が1対話)収集した.総発話数は193046発話となり,1対話中の平均発話数は497.54であった.さらに,対話文を分類して発話意図タグを設計した.発話意図タグは発話の機能と発話の欲求によって設計した.設計したタグは,a1, a2s,a2m,q1k,q2k,ds,dk,w,z,fの10種類である.a1は情報の提供(Yes/No可能),a2情報の提供(Yes/No以外),q1は情報の要求(Yes/No可能), q2は情報の要求(Yes/No以外),dは注目や理解の提供(相槌)などとした.また,人間の欲求リストから発話に関連する欲求を割り当てた.s,m,kはそれぞれ親和・服従欲求,承認・顕示・証明欲求,認知欲求とした.設計した発話意図タグが作業者によってぶれずに付与できるのかを確認するために発話意図タグの付与実験を行った.実験には作成したインタビュー対話コーパスから6対話を用いた.発話意図タグ設計者と非設計者の2名が作業を行った.2名によるタグ付与結果の一致率の計算にはCohenのカッパ係数を用いた.カッパ係数は0.67以上のときに十分な信頼性があるとみなす.実験の結果1つの対話(0.66)を除き0.67以上あり,作業者によるぶれが少ないタグが設計できたと言える.研究分担者は,発話意図と発話文の関係を,自己相互情報量,勾配ブースティング,K近傍法,多層パーセプトロン,およびBERTとt-SNEを用いた可視化などの複数の観点から分析を行った.分析結果から,設計した発話意図タグは,発話文単体の特徴のみでは識別しづらいものが存在することが分かった. 研究成果としては,研究代表者は情報処理学会第82回全国大会において発表を行い,研究分担者は第15回日本感性工学会春季大会で発表を行った.
|