本研究は、自動採点の技術を用いて、第二言語としての英語学習者(外国語としての英語学習者を含む)の話し言葉の習熟度を自動評価するものである。本研究では、NICT JLE Corpusを主な分析データとし、Biber (1988) で用いられている言語項目に関する情報をデータに付与した。そして、分析に用いた手法は、他の手法よりも比較的高い分類精度が得られると報告されているランダムフォレスト法である。その結果、9段階の習熟度を61.28%の精度で正しく分類できた。これは、ベースラインの精度よりも37.63ポイント高いものである。また、分類に大きく寄与した言語項目は、前置詞、人称代名詞などであった。
|