研究概要 |
英語教育の分野では、数多くの英語力テストが存在し、中学校や高校のカリキュラムに組み込まれている場合もある。これらのテストの多くは、熟練した教師や採点者が学習者の作文や発話を評価するという形式を取っている。しかし、いかに熟練した採点者たちが厳密な基準に基づいて評価を下したとしても、複数の採点者間の評価が一致しないこともある。そのような状況において、客観的な評価基準と統計モデルを用いて習熟度を推定する技術を開発することは、言語教育分野にとって非常に有意義なことである。 本研究では、英語学習者の習熟度を自動推定すると同時に、その推定に寄与する言語項目を特定することを目的としている。具体的には、異なる習熟度グループに属する日本人英語学習者の言語パフォーマンスを対象に、多種多様な言語項目(語彙, 品詞, 統語, 談話など)を変数とし、習熟度の推定と言語項目の特定を行う。 平成25年度は、前年度の基礎的な調査から得られた知見に基づき、日本人英語学習者約1200人の習熟度推定実験を行った。このような実験を行う場合、どのような言語項目を変数として用いるかが問題になるが、本研究では、コーパス言語学およびテクスト変種の研究で高い評価を得ているDouglas Biberの言語項目のリストを援用した。また、判定のためのデータ解析手法には、Leo Breimanが提案した決定木のアンサンブル学習であるランダムフォレストを用いた。 その結果、判定の精度は61.28%で, 専門的な訓練を受けた人間の評価官による評価との相関係数は0.867であった。また, 推定に寄与した言語項目は, 総語数と異語数に加えて, 前置詞句, 1人称代名詞, 副詞, 否定, 短縮形, 不定詞, 時制などの頻度であった。
|