2020 Fiscal Year Research-status Report
An attempt at a comprehensive error analysis using learner corpus and natural language processing techniques
Project/Area Number |
20K21977
|
Research Institution | Matsuyama University |
Principal Investigator |
西村 嘉人 松山大学, 経済学部, 講師 (00882432)
|
Project Period (FY) |
2020-09-11 – 2022-03-31
|
Keywords | 誤用分析 / 誤用検出 / 学習者コーパス / 自然言語処理 / L2ライティング |
Outline of Annual Research Achievements |
本研究の目的は、誤用分析における人的・時間的コストの削減に取り組み、誤用分析の自動化手順を確立することを目指すことである。この研究目的を遂行するために、2021年度は、主に誤用分析に関わる先行研究の渉猟を行い、体系的にまとめる作業に着手した。概ね、最新の誤用分析に関わる研究動向を把握し、先行研究の問題点をまとめ、これから解決するべき点を洗い出した。具体的には、応用言語学の第二言語習得研究の分野では、1960年代の初期の研究から現代の研究まで幅広く収集し先行研究分析を行った。また、自然言語処理分野では、誤用検出プログラムの一つであるERRANT(ERRor ANnotation Toolkit: Automatically extract and classify grammatical errors in parallel original and corrected sentences)(本研究でも使用予定)に関する論文を中心に収集し、最新の誤用検出の研究動向の把握も行った。また、誤用分析を行うためのデータの前処理を部分的に行った。具体的には、本研究で遂行する誤用分析には、英語学習者の英作文に対する英語母語話者による添削文を付与する必要があり、分析のためのフォーマット調整を行う必要がある。そのため、英語学習者の英作文に対して一文ごとにパラレルに英語母語話者による添削文を付与するためのフォーマット調整を自動で行えるようにするテキスト整形のプログラムを作成し、そのプログラムの動作確認を行い、正常に動作することを確認した。 以上の実績から、2020年度は、誤用分析や誤用検出に関わる先行研究の渉猟と、本分析を行うための前処理を中心に行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
2020年度は本来、英語母語話者による添削文の付与を行い、自然言語処理プログラムを用いた誤用分析までを行う計画としていたが、新型コロナウイルス感染症の影響で大学での授業が完全にオンラインに移行したことで、その環境整備や準備に多大な時間を要したため、本研究の遂行に割ける時間が減少した。しかしながら、最終年度となる2021年度内には、当初の研究計画通りに研究を遂行できる見込みが立っているため、問題はない。
|
Strategy for Future Research Activity |
2021年度は、学習者コーパスに収録されている300人分の日本語を母語とする英語学習者の英作文データのすべての文に対して、英語母語話者による添削文を付与する。英語母語話者による添削文を付与したのち、自然言語処理プログラムを使用することで誤用分析を行い、日本語を母語とする英語学習者の誤用傾向を体系的に記述する。また、熟達度ごとによる誤用傾向も検証する。
|
Causes of Carryover |
研究遂行にやや遅れが生じ、2020年度内に使用する予定だった経費の一部を執行しなかったため。繰り越した経費は、2021年度に執行予定である。
|