研究概要 |
本年度は,(1)学習者データの収集,(2)さまざまな変数を用いた習熟度推定,(3)習熟度判定技術の開発,の3点に取り組んだ。 (1)学習者データの収集:習熟度判定の対象とする日本人英語学習者による英作文データは,京都大学の協力を得て収集した。このデータには,TOEFL準拠の習熟度情報が付与されており,判定実験の正解データとして用いることが可能である。今後,同様のデータを中央大学でも収集する予定である。 (2)さまざまな変数を用いた習熟度推定:今年度は,語数や文長のような基本的なテキスト情報を使った判定実験のみならず(電子情報通信学会技術研究報告に発表),語の意味情報やテキストの一貫性に注目した判定実験(人文科学とコンピュータシンポジウム論文集に発表),テキストの構文情報とメタ談話情報に注目した判定実験を行った。 (3)習熟度判定技術の開発:膨大な数の変数を効率的に扱うために,バイオインフォマティクスやウェブ解析で用いられているランダムフォレスト法を言語研究に応用した。この手法は,他の手法に比べて高い分類精度を実現するだけでなく,分類に寄与した変数の重要度を推定することができるため,言語学的にも有益なフィードバックを得ることができる。 上記の点に関して,一定の成果が得られ次第,国内外の学会で報告を行い,関連分野の研究者から多くのフィードバックを得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
初年度ではあるが,申請課題で掲げたサブテーマのほとんどを並列的に推進し,なおかつ国内外の学会・研究会において,論文発表や口頭発表を行っていることから,上記評価と判断した。
|
今後の研究の推進方策 |
今後の展開としては,まず学習者データを拡充し,より一般化が可能な形での研究を推進することである。また,パターン認識という観点から言えば,データの拡充が判定精度の向上につながることも多い。 そして,語彙,構文,談話といった言語的な側面を個別に評価するのではなく,ブースティングなどの重みつきアンサンブル学習を援用することで,より多角的な評価の実現を模索する。 さらに,単なる量的な分析にとどまることなく,言語教育現場のフィードバックも参考にし,より実用的な判定システムの構築を目指す。
|