2023 Fiscal Year Annual Research Report
Estimating Extensive Reading Text Difficulty Using Machine Learning
Project/Area Number |
20K00800
|
Research Institution | Shinshu University |
Principal Investigator |
Brierley Mark 信州大学, 全学教育センター, 外国語准教授 (70646877)
|
Co-Investigator(Kenkyū-buntansha) |
新村 正明 信州大学, 学術研究院総合人間科学系, 教授 (20345755)
RUZICKA DAVID 信州大学, 学術研究院総合人間科学系, 准教授 (70436898)
長谷部 めぐみ 信州大学, 学術研究院総合人間科学系, 准教授 (50878725)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 多読 / 難易度 / 機械学習 |
Outline of Annual Research Achievements |
多読とは,大意を把握するような読み方,いわゆる通読により多量の本を読むものであり,読解力や語学能力を高める学習方法として利用されている.この多読学習のために,難易度が段階的に調整された図書(以後,多読図書と呼ぶ)が複数の出版社から数多く出版されている.多読の学習効果を高めるためには,学習者は適切な難易度の多読図書を選択する必要がある.このため,出版社や多読支援団体が図書毎に難易度を定めているが,それぞれが異なる評価を行っており,統一された難易度とは言い難い. 我々は,多読支援システムを開発し,10年以上,実際の授業で運用しデータの蓄積を行ってきた.本研究では,実際の運用で蓄積された学習者による難易度評価や図書に含まれる単語の種類等のデータ等を機械学習し,多読図書の難易度を自動推定するシステムの開発を行う.従来の手法では,単語の難易度,出現数,構造等から難易度測定の理論に基づき定式化を行っている.これに対し,機械学習においては,主に入力データの選定・整形,機械学習手法の選定と機械学習による推定,出力データの妥当性の判定を繰り返し行い,機械学習の精度を高めて行く必要がある. 昨年度までに,入力データの選定・整形と試験的な機械学習を行い,文章内の係り受け関係が難易度推定に有効であるという知見を得られ,さらに様々なパラメータについて調査し,難易度推定への寄与度の高いパラメータの特定を行った. 本年度は,難易度推定の精度を検証を行うとともに,対象を一般図書にも広げた.これにより,多読学習に利用可能な一般図書の特徴を抽出し,多読に利用可能な図書の範囲を広げることに成功した.
|
Research Products
(1 results)