2022 Fiscal Year Research-status Report
Estimating Extensive Reading Text Difficulty Using Machine Learning
Project/Area Number |
20K00800
|
Research Institution | Shinshu University |
Principal Investigator |
Brierley Mark 信州大学, 全学教育機構, 外国語准教授 (70646877)
|
Co-Investigator(Kenkyū-buntansha) |
新村 正明 信州大学, 学術研究院総合人間科学系, 教授 (20345755)
RUZICKA DAVID 信州大学, 学術研究院総合人間科学系, 准教授 (70436898)
長谷部 めぐみ 信州大学, 学術研究院総合人間科学系, 助教 (50878725)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 多読 / 難易度 / 機械学習 |
Outline of Annual Research Achievements |
多読とは,大意を把握するような読み方,いわゆる通読により多量の本を読むものであり,読解力や語学能力を高める学習方法として利用されている.この多読学習のために,難易度が段階的に調整された図書(以後,多読図書と呼ぶ)が複数の出版社から数多く出版されている.多読の学習効果を高めるためには,学習者は適切な難易度の多読図書を選択する必要がある.このため,出版社や多読支援団体が図書毎に難易度を定めているが,それぞれが異なる評価を行っており,統一された難易度とは言い難い. 我々は,多読支援システムを開発し,10年以上,実際の授業で運用しデータの蓄積を行ってきた.本研究では,実際の運用で蓄積された学習者による難易度評価や図書に含まれる単語の種類等のデータ等を機械学習し,多読図書の難易度を自動推定するシステムの開発を行う.従来の手法では,単語の難易度,出現数,構造等から難易度測定の理論に基づき定式化を行っている.これに対し,機械学習においては,主に入力データの選定・整形,機械学習手法の選定と機械学習による推定,出力データの妥当性の判定を繰り返し行い,機械学習の精度を高めて行く必要がある. 昨年度までに,入力データの選定・整形と試験的な機械学習を行い,文章内の係り受け関係が難易度推定に有効であるという知見が得られた.今年度は,さらに様々なパラメータについて調査し,難易度推定への寄与度の高いパラメータの特定を行うことができた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初計画どおり,難易度推定への寄与度の高いパラメータの特定を行うことができた. しかし,新型コロナウィルス対応のため,学生を集めた実験が困難となり,多読支援システムに蓄積された過去のデータによる推定のみとなった.推定ではあるが良好な結果が得られていることから,おおむね順調に進展している.
|
Strategy for Future Research Activity |
学生を集めての実験を実施し,推定結果の評価及び高精度化を実施する. また,新型コロナウィルス対応のため成果普及が十分ではなかったことから,積極的な成果普及を行うほか,他の研究者と意見交換を行うことにより,推定方法の高度化の検討を行う.
|
Causes of Carryover |
国際学会での発表のための旅費が,学会がオンライン開催となったことから未執行となった.また,実験用の多読図書を購入予定であったが,対面授業の一部停止により実験実施が困難となったため.図書購入を見送った.学会発表及び実験を翌年度に実施するよう計画変更を行い,予算の繰越を行うこととした.
|
Research Products
(7 results)