2023 年度実績報告書

言語学習者の誤用に注目した単語と文の分散表現の獲得と分析

研究課題

研究課題/領域番号	19KK0286
研究機関	一橋大学
研究代表者	小町守一橋大学, 大学院ソーシャル・データサイエンス研究科, 教授 (60581329)
研究期間 (年度)	2020 – 2023
キーワード	自然言語処理 / 言語学習
研究実績の概要	2022年度の後半に ChatGPT が登場し、2023年度は大規模言語モデルが自然言語処理の様々なタスクで広く使われるようになりました。それに合わせて既存の深層学習時代以前から用いられている英語文法誤り訂正の評価データセットでは、言語学習者の書く文法誤り訂正システムの評価を適切に行えない、という仮説を立て、実験によって私たちの仮説が正しいことを明らかにしました。中国語文法誤り訂正においても、広く用いられている評価データセットに関する包括的な検証及び深層学習手法の出力を含むデータセット構築を行いました。また、日本語文法誤り訂正の評価データセットを公開し、研究目的で広く使えるようにしました。研究期間全体を通じて、英語・日本語・中国語の文法誤り訂正に関するデータセットの構築と、深層学習を用いた文法誤り訂正システムの出力の分析、そしてそれらについての包括的な評価に取り組みました。また、これら3言語以外の言語も含めた多言語の文法誤り訂正において、深層学習の発展に伴って様々な手法の評価と分析を行いました。以下は、研究期間全体を通じて実施した研究成果の概要です。(1) 事前学習モデル (BART, BERT) の適用 (2) 非自己回帰モデルによる高速化 (3) 学習者の誤りを考慮した擬似学習者コーパスを用いた手法の提案 (4) 文法誤り訂正出力の多様性の分析と改善 (5) 多言語モデルによる文法誤り訂正の知識の転移学習 (6) 参照文を用いない文法誤り訂正の自動評価手法の開発およびデータセット構築

研究成果
(6件)

すべて 2024 2023

すべて国際共同研究 (1件) 雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 2件) 学会発表 (3件) (うち国際学会 1件)

[国際共同研究] ケンブリッジ大学(英国)2023
- 年月日
  2023-06-27 – 2024-03-01
- 国名
  英国
- 外国機関名
  ケンブリッジ大学
- 主な海外共同研究者名
  Simone Teufel
- 職名
  Professor
[雑誌論文] Revisiting Meta-evaluation for Grammatical Error Correction2024
- 著者名/発表者名
  Masamune Kobayashi, Masato Mita, Mamoru Komachi
- 雑誌名
  
  Transactions of the Association for Computational Linguistics
  
  巻: －ページ: －
- 査読あり / オープンアクセス
[雑誌論文] Construction of an Error-Tagged Evaluation Corpus for Japanese Grammatical Error Correction2023
- 著者名/発表者名
  Koyama Aomi、Kiyuna Tomoshige、Kobayashi Kenji、Arai Mio、Mita Masato、Oka Teruaki、Komachi Mamoru
- 雑誌名
  
  Journal of Natural Language Processing
  
  巻: 30 (2) ページ: 330～371
- DOI
  10.5715/jnlp.30.330
- 査読あり / オープンアクセス
[学会発表] Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction2024
- 著者名/発表者名
  Masamune Kobayashi, Masato Mita, Mamoru Komachi
- 学会等名
  19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024)
- 国際学会
[学会発表] 文法誤り訂正の包括的メタ評価: 既存自動評価の限界と大規模言語モデルの可能性2024
- 著者名/発表者名
  小林正宗, 三田雅人, 小町守
- 学会等名
  言語処理学会第30回年次大会
[学会発表] 文法誤り訂正におけるメタ評価の再考2023
- 著者名/発表者名
  小林正宗, 三田雅人, 小町守
- 学会等名
  情報処理学会第258回自然言語処理・第149回音声言語情報処理合同研究発表会

2023 年度 実績報告書

言語学習者の誤用に注目した単語と文の分散表現の獲得と分析

研究代表者

小町 守 一橋大学, 大学院ソーシャル・データサイエンス研究科, 教授 (60581329)

研究成果

[国際共同研究] ケンブリッジ大学(英国)2023

年月日

国名

外国機関名

主な海外共同研究者名

職名

[雑誌論文] Revisiting Meta-evaluation for Grammatical Error Correction2024

著者名/発表者名

雑誌名

[雑誌論文] Construction of an Error-Tagged Evaluation Corpus for Japanese Grammatical Error Correction2023

著者名/発表者名

雑誌名

DOI

[学会発表] Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction2024

著者名/発表者名

学会等名

[学会発表] 文法誤り訂正の包括的メタ評価: 既存自動評価の限界と大規模言語モデルの可能性2024

著者名/発表者名

学会等名

[学会発表] 文法誤り訂正におけるメタ評価の再考2023

著者名/発表者名

学会等名

2023 年度実績報告書

小町守一橋大学, 大学院ソーシャル・データサイエンス研究科, 教授 (60581329)