研究課題/領域番号 |
26370619
|
研究機関 | 常葉大学 |
研究代表者 |
谷 誠司 常葉大学, 外国語学部, 准教授 (80514827)
|
研究分担者 |
宮崎 佳典 静岡大学, 情報学部, 教授 (00308701)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | 日本語教育 / 韓国人日本語学習者 / CEFR / Can-do statements / 機械学習 / 基準特性 / 自動抽出 |
研究実績の概要 |
昨年度は、CEFR-DIALANG self-assessment statementsにおける読解能力記述文(Can-do statements、以下CDS)31個から熟達段階のC1、 C2レベルと、語彙力に関して記述してあるB2レベルの1個を除いた27個のCDSを対象にして収集された例文をCDSの「文書タイプ」、「専門性」、「長さ」の3つの要素に着目し、この3点から例文の特徴量を抽出し、例文に対応するであろうCDSを判定する手法を検討した。 今年度は昨年度の研究では手動で行っていた「文書タイプ」の自動推定と「専門性」の推定精度向上に取り組み、「文書タイプ」、「専門性」、「長さ」の自動抽出化により、例文からのCDS判定の精度がどの程度変化するかを確認した。「文書タイプ」の自動推定については、1) 品詞情報を利用した手法、2) doc2vecを利用した手法、3) fastTextを利用した手法を用い、自動推定結果を3分割交差検定から評価した。その結果、fastTextを用いた手法の精度が最も高い結果になった。「専門性」の推定精度向上については、A) 専門語との類似度を利用した手法、B) doc2vecを利用した手法、C) fastTextを利用した手法を用い、自動推定結果を5分割交差検定から評価した。その結果、fastTextを用いた手法の精度が最も高い結果になった。「文書タイプ」、「専門性」、「長さ」の自動抽出化によるCDS判定の精度については、「文書タイプ」を手動で行っていたときの平均精度と比べて、2%程度の減少に留まり、全自動にしても分類は有効だと考えられた。
|