2020 Fiscal Year Research-status Report
Estimating Extensive Reading Text Difficulty Using Machine Learning
Project/Area Number |
20K00800
|
Research Institution | Shinshu University |
Principal Investigator |
Brierley Mark 信州大学, 全学教育機構, 外国語准教授 (70646877)
|
Co-Investigator(Kenkyū-buntansha) |
新村 正明 信州大学, 学術研究院工学系, 准教授 (20345755)
RUZICKA DAVID・ED 信州大学, 学術研究院総合人間科学系, 准教授 (70436898)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 多読 / 難易度推定 / 機械学習 |
Outline of Annual Research Achievements |
多読とは,大意を把握するような読み方,いわゆる通読により多量の本を読むものであり,読解力や語学能力を高める学習方法として利用されている.この多読学習のために,難易度が段階的に調整された図書(以後,多読図書と呼ぶ)が複数の出版社から数多く出版されている.多読の学習効果を高めるためには,学習者は適切な難易度の多読図書を選択する必要がある.このため,出版社や多読支援団体が図書毎に難易度を定めているが,それぞれが異なる評価を行っており,統一された難易度とは言い難い. 我々は,多読支援システムを開発し,10年以上,実際の授業で運用しデータの蓄積を行ってきた.そこで本研究では,実際の運用で蓄積された学習者による難易度評価や図書に含まれる単語の種類等のデータ等を機械学習し,多読図書の難易度を自動推定するシステムの開発を行う. 従来の手法では,単語の難易度,数,構造等から難易度測定の理論に基づき定式化を行っている.これに対し,機械学習においては,主に入力データの選定・整形,機械学習手法の選定と機械学習による推定,出力データの妥当性の判定を繰り返し行い,機械学習の精度を高めて行く必要がある.そこで本年度は,入力データの選定・整形と機械学習手法の選定を行った.また,機械学習手法を1つ選定し,選定・整形した入力データに対して試験的な機械学習を行った.この結果,ある程度の難易度推定が可能であることを示唆する結果が得られた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初計画では,本年度は入力データの選定・整形と機械学習手法の選定を行うこととなっていた.しかし,選定した機械学習手法を1つに対し,選定・整形した入力データを与えることで試験的な機械学習を行い,ある程度の難易度推定が可能であることを示唆する結果が得られた.このことから,おおむね順調に進展している.なお,簡易的な実験を行う予定であったが,新型コロナウィルス対応のため,学生を集めた実験が困難となった.これは,予備実験であるので,計画全体への影響は少ない.
|
Strategy for Future Research Activity |
当初計画では,本年度は入力データの選定・整形と機械学習手法の選定を行うことになっていたが,1つの機械学習手法について難易度推定が可能であることを示唆する結果が得られた.このことから,複数の機械学習方法や,入力データセットを増やすなど,試行回数を増やして実験を進める予定である.
|
Causes of Carryover |
実験用の多読用図書を購入する予定であったが,新型コロナウィルス対応により学生を集めた実験の実施が困難となったことから,本年度の購入を延期することとした.残額については,実験計画の見直しを行い,来年度に図書購入費として使用する予定である.
|
Research Products
(5 results)