2021 Fiscal Year Research-status Report
Estimating Extensive Reading Text Difficulty Using Machine Learning
Project/Area Number |
20K00800
|
Research Institution | Shinshu University |
Principal Investigator |
Brierley Mark 信州大学, 全学教育機構, 外国語准教授 (70646877)
|
Co-Investigator(Kenkyū-buntansha) |
新村 正明 信州大学, 学術研究院工学系, 准教授 (20345755)
RUZICKA DAVID 信州大学, 学術研究院総合人間科学系, 准教授 (70436898)
長谷部 めぐみ 信州大学, 学術研究院総合人間科学系, 助教 (50878725)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 多読 / 難易度 / 機械学習 |
Outline of Annual Research Achievements |
多読とは,大意を把握するような読み方,いわゆる通読により多量の本を読むものであり,読解力や語学能力を高める学習方法として利用されている.この多読学習のために,難易度が段階的に調整された図書(以後,多読図書と呼ぶ)が複数の出版社から数多く出版されている.多読の学習効果を高めるためには,学習者 は適切な難易度の多読図書を選択する必要がある.このため,出版社や多読支援団体が図書毎に難易度を定めているが,それぞれが異なる評価を行っており,統一された難易度とは言い難い. 我々は,多読支援システムを開発し,10年以上,実際の授業で運用しデータの蓄積を行ってきた.本研究では,実際の運用で蓄積された学習者による難易度評価や図書に含まれる単語の種類等のデータ等を機械学習し,多読図書の難易度を自動推定するシステムの開発を行う. 従来の手法では,単語の難易度,出現数,構造等から難易度測定の理論に基づき定式化を行っている.これに対し,機械学習においては,主に入力データの選定・整形,機械学習手法の選定と機械学習による推定,出力データの妥当性の判定を繰り返し行い,機械学習の精度を高めて行く必要がある. 昨年度は,入力データの選定・整形と試験的な機械学習を行い,ある程度の難易度推定が可能であることを示唆する結果が得られた.これを受け,本年度は,様々な入力データパターンに対して機械学習を行った.この結果,文章内の係り受け関係が難易度推定に有効であるという知見が得られた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初計画通り,難易度推定に有効と思われるデータセットを見いだすことができた.しかし,新型コロナウィルス対応のため,学生を集めた実験が困難となり,多読支援システムに蓄積された過去のデータによる推定のみとなった.推定ではあるが良好な結果が得られていることから,おおむね順調に進展している.
|
Strategy for Future Research Activity |
今年度の結果により難易度推定の実現可能性が示されたことから,機械学習方法や新しい入力データセットの追加などを行い,試行回数を増やして実験を進める予定である. また,学生を集めての実験を実施し,推定結果の高精度化を図る予定である.
|
Causes of Carryover |
国際学会での発表のための旅費が,学会がオンライン開催となったことから未執行となった. また,実験用の多読図書を購入予定であったが,対面授業の一部停止により実験実施が困難となったため.図書購入を見送った. 学会発表及び実験を翌年度に実施するよう計画変更を行い,予算の繰越を行うこととした.
|
Research Products
(2 results)