2021 Fiscal Year Annual Research Report
An attempt at a comprehensive error analysis using learner corpus and natural language processing techniques
Project/Area Number |
20K21977
|
Research Institution | Matsuyama University |
Principal Investigator |
西村 嘉人 松山大学, 経済学部, 講師 (00882432)
|
Project Period (FY) |
2020-09-11 – 2022-03-31
|
Keywords | 誤用分析 / 誤用検出 / 学習者コーパス / 自然言語処理 / L2ライティング |
Outline of Annual Research Achievements |
本研究の目的は、誤用分析における人的・時間的コストの削減に取り組み、誤用分析の自動化手順を確立することを目指すことである。この研究目的を遂行するために、最終年度である2021年度は、日本語を母語とする英語学習者の英作文に対して、一文ごとにパラレルに英語母語話者による添削文の付与を専門の会社に依頼し、合計で240ファイル分の英語母語話者による添削文の付与を行った。英語学習者の英作文と英語母語話者による添削文を比較することで自動で誤用が検出可能なプログラムである、ERRANT(ERRor ANnotation Toolkit: Automatically extract and classify grammatical errors in parallel original and corrected sentences)を使用することで、文法的及び語彙的誤用の分類と集計を行った。この集計を行うために、ERRANTの出力結果をもとにカテゴリーごとの誤用を分類し集計するプログラムをPythonで作成した。また、学習者の英作文に対して、一文ごとに英語母語話者による主観的な評価と、英語学習者による主観的な評価を0から3の4段階で評価の付与を行った。誤用のカテゴリーや種類だけでなく、どのような誤用がコミュニケーションを阻害するのか或いはしないのかを分析した。2021年度の後半は、本研究課題で得られた結果を論文としてまとめ、国際学術雑誌に投稿したが、研究期間内に出版することは出来なかった。しかしながら、現在も本研究課題で得られた成果をまとめた論文は査読中である。
|