当該年度は,前年度設計した発話意図タグ10種類を18種類に拡張し,30コーパスに対して拡張した発話意図タグを付与した.10種類ではタグ付与の作業者間の一致度は高い半面,特定のタグが非常に多く出現してしまい,出現頻度に偏りが生じるという問題があった.新たに2 階層の発話意図タグを設計した.まず,基本的な対話の意図を中心に 8 種類(質問,回答,相槌など)の発話意図タグ (第一階層) を定義した.さらに,第二階層の発話意図タグを定義した.第二階層は,第一階層のうち「質問」「回答」「相槌」「感想」の 4 種類についてそれぞれ細分化した 14 種類(質問-用意,質問-意見,質問-その他など)を定義した.インタビュー対話コーパス 30 対話に対し作成した発話意図タグを付与する.1発話に対し第一階層 1つ,第二階層1つを付与する.発話意図タグを付与する作業者は18歳から24歳の男性10名である.30対話中6対話は5名が発話意図タグを付与し,24対話は3名がタグを付与した.偶然の一致率を考慮したFleissのカッパ係数は「3 名がタグ付与」では0.55であり,解釈は moderate agreementとなる.「5 名がタグ付与」でも 0.54 となっており,ほぼ同様である.設計したインタビュー対話コーパスへの発話意図タグにある程度の信頼性があることがわかった. 研究成果としては,当該年度にジャーナル2件,査読付き国際会議2件を発表している.設計した発話意図タグと信頼性についてNLPIR2021で発表した.また,研究分担者が,作成した発話意図タグ付きインタビュー対話コーパスを用いて,発話のトピックの分類を提案しジャーナルsensorsに掲載された.
|