研究課題/領域番号 |
19KK0286
|
研究種目 |
国際共同研究加速基金(国際共同研究強化(A))
|
配分区分 | 基金 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 一橋大学 (2023) 東京都立大学 (2019-2022) |
研究代表者 |
小町 守 一橋大学, 大学院ソーシャル・データサイエンス研究科, 教授 (60581329)
|
研究期間 (年度) |
2020 – 2023
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
12,610千円 (直接経費: 9,700千円、間接経費: 2,910千円)
|
キーワード | 自然言語処理 / 深層学習 / 文法誤り訂正 / 言語学習支援 / 言語教育支援 / 言語学習 / 事前学習モデル / 疑似誤り |
研究開始時の研究の概要 |
本国際共同研究では、言語学習者のライティングに存在する「誤り」に着目し、言語学習者がどのような単語や文を書いているのかの分析を行います。言語学習者が実際に書いた文章だけでなく、大規模データを用いて擬似的に誤りを発生させることで、様々な種類の誤りを分析するだけでなく、複数の言語で比較することで言語横断的な分析をも可能にする、というのが本研究の狙いです。
|
研究成果の概要 |
英語・日本語・中国語の文法誤り訂正に関するデータセットの構築と、深層学習を用いた多言語の文法誤り訂正システムの出力の分析と包括的な評価に取り組みました。以下は、研究期間全体を通じて実施した研究成果の概要です。(1) 文法誤り訂正への事前学習モデルの適用 (2) 文法誤り訂正システムの高速化 (3) 学習者の誤りを考慮した擬似学習者コーパスを用いた文法誤り訂正手法の提案 (4) 文法誤り訂正出力の多様性の分析と改善 (5) 多言語モデルによる文法誤り訂正の言語知識の転移学習 (6) 文法誤り訂正の自動評価手法の開発およびデータセット構築
|
研究成果の学術的意義や社会的意義 |
本研究を通じて、最先端の深層学習を用いた文法誤り訂正手法の到達点と限界について明らかになりました。文法誤り訂正の性能が見違えるように改善された一方、これまで用いられてきた文法誤り訂正の評価データセットが深層学習時代の文法誤り訂正手法の評価には適さないことが明らかになり、多言語での評価用のデータセットの構築や、それらを用いた適切な評価尺度の開発の必要性が示唆され、言語学習者の誤用の評価の重要性が再確認されました。
|