研究実績の概要 |
対話コーパスの不足が対話システムを研究開発する上で大きな障壁となっている。そこで本研究では大規模対話コーパス構築と、構築したコーパスを用いた対話システムの構築に取り組む。最終年度はこれまでの成果をさらに深め、(1) 直接・間接的表現の言い換え対話コーパスの構築、(2) ユーザの話題に即した応答生成、の二つの課題に取り組んだ。 (1) について、既存の対話コーパスの詳細な分析を実施したところ、ユーザは自身の意図を直接的に表現するとは限らず、間接的表現を用いることが多々あることが分かった。例えばレストラン予約サービスにおいて、ユーザが「ちょっと予算オーバーです。」と言った場合、その意図は「もっと安いレストランを探して欲しい。」と考えられる。このような間接的に表現された意図の理解は語用論的言い換え問題として知られており、言語処理における困難な課題である。語用論的言い換えによりユーザの意図を理解した対話システムを構築するため、広く用いられている対話コーパスであるMultiWoZに含まれる71,498の発話を直接的・間接的に人手で言い換えたコーパスを構築した。本コーパスは世界で初めての語用論的言い換えコーパスであり、対話システムへの応用を始め多くのアプリケーションに貢献する貴重な言語資源である。 (2) について、我々はこれまで多様な応答を生成する対話システムを開発してきた。最終年度は本技術をさらに深め、ユーザの話題に即しかつ情報量の多い応答を生成する技術を実現した。ユーザの発話に含まれる特徴的な単語と頻繁に共起する単語の出力を促進することで、ユーザの話題に合致し、かつ情報量の大きい応答を生成できる。本成果はConference on Empirical Methods in Natural Language Processing: Findingsに採択されている。
|