研究課題
本研究の第一の目的は、より人間に近いモデルを採用することで、人間のように自然な「間」を自動的に生成することである。たとえば人間同士であれば、「お互いに発話しかけて譲りあいどちらも話し始められない」といったシーンがみられるが、既存システム同士ではこれを本質的に再現できていない。また近年の多くの研究では、書き言葉を主眼においている点、統計的手法の隆盛により、書き言葉を前提に大規模データと潤沢な計算資源を用いた処理が行われてきた。一方で人間のほうが高精度であるだけでなく、計算量も少ないであろうことは、古くから心理学的実験により知られている。こうした点を踏まえ、心理学的に妥当なモデルにより解析器を構築する。相槌および会話中の割込タイミングを、この解析器を用いて自動的に推測することを目標とし、その判断基準となる手がかり(特徴量)の発見と分析を行うことが第二の目的である。本年度は、話し言葉の自動解析を行うための基盤として、録音会話データに対する言語学的アノテーションの付与をプロトタイプ的に行った。既存コーパスの言語学的アノテーションは書き言葉に対するものが中心であり、話し言葉の場合にどのようなアノテーションを付与すべきかは検討の余地が大きく残されている。そこで、話し言葉特有の課題としてどのようなものがあるかの洗い出しを行い、ガイドラインとしての整備を進めた。また、相槌のタイミングを評価するために、そのアノテーションの種類の策定と、試行的なアノテーション付与を行った。
2: おおむね順調に進展している
話し言葉の自動解析を行うための基盤として、録音会話データに対するアノテーション付与をプロトタイプ的に行った。既存の言語学的アノテーションは書き言葉に対するものが中心であり、話し言葉特有の課題としてどのようなものがあるかの洗い出しを行い、ガイドラインとしての整備を進めた。また、相槌のタイミングを評価するために、そのアノテーションの種類の策定と、試行的なアノテーション付与を行った。これらの進捗から、本年度の目標はおおむね達成した。
構築してきたアノテーションデータを用いて、解析器の構築と、自動的な「間」の判定を行う予定である。
想定よりもデータ作成費用が少なかったため。翌年度のデータ作成・システム環境構築費用として使用する。
すべて 2020 2019
すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (7件) (うち国際学会 4件、 招待講演 2件)
Transactions of the Japanese Society for Artificial Intelligence
巻: 35 ページ: DSI~F_1-13
https://doi.org/10.1527/tjsai.DSI-F
Studies in Computational Intelligence
巻: 843 ページ: 111~118
https://doi.org/10.1007/978-3-030-24409-5_10
巻: 843 ページ: 83~95
https://doi.org/10.1007/978-3-030-24409-5_8