研究実績の概要 |
2022年度の後半に ChatGPT が登場し、2023年度は大規模言語モデルが自然言語処理の様々なタスクで広く使われるようになりました。それに合わせて既存の深層学習時代以前から用いられている英語文法誤り訂正の評価データセットでは、言語学習者の書く文法誤り訂正システムの評価を適切に行えない、という仮説を立て、実験によって私たちの仮説が正しいことを明らかにしました。中国語文法誤り訂正においても、広く用いられている評価データセットに関する包括的な検証及び深層学習手法の出力を含むデータセット構築を行いました。また、日本語文法誤り訂正の評価データセットを公開し、研究目的で広く使えるようにしました。
研究期間全体を通じて、英語・日本語・中国語の文法誤り訂正に関するデータセットの構築と、深層学習を用いた文法誤り訂正システムの出力の分析、そしてそれらについての包括的な評価に取り組みました。また、これら3言語以外の言語も含めた多言語の文法誤り訂正において、深層学習の発展に伴って様々な手法の評価と分析を行いました。以下は、研究期間全体を通じて実施した研究成果の概要です。(1) 事前学習モデル (BART, BERT) の適用 (2) 非自己回帰モデルによる高速化 (3) 学習者の誤りを考慮した擬似学習者コーパスを用いた手法の提案 (4) 文法誤り訂正出力の多様性の分析と改善 (5) 多言語モデルによる文法誤り訂正の知識の転移学習 (6) 参照文を用いない文法誤り訂正の自動評価手法の開発およびデータセット構築
|