Identification of latent skill dynamics and visualization of learning effect by educational data mining
Project/Area Number |
19H01728
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Basic Section 09070:Educational technology-related
|
Research Institution | Kisarazu National College of Technology |
Principal Investigator |
大枝 真一 木更津工業高等専門学校, 情報工学科, 教授 (80390417)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥12,350,000 (Direct Cost: ¥9,500,000、Indirect Cost: ¥2,850,000)
Fiscal Year 2023: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
Fiscal Year 2022: ¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2021: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
Fiscal Year 2020: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
Fiscal Year 2019: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
|
Keywords | 教育データマイニング / Skill Modeling / Student Modeling / 初等プログラミング教育 / 機械学習 / 潜在スキル構造 / プログラミング教育 / 学習中のログデータ / Q-matrix / 学習効果の可視化 / 潜在的スキル構造 |
Outline of Research at the Start |
ビジネスや医療の分野ではデータマイニングの研究が盛んである.しかし,教育の分野においては,膨大な試験結果とログデータの蓄積というビッグデータがあるにもかかわらず,機械学習を用いて潜在的スキル構造を抽出するデータマイニング手法は確立していない.そこで,試験結果と学習過程のログデータから,知識を修得するために必要な潜在的スキル構造を自動抽出するデータマイニング技術を開発する.調査対象はプログラミング教育とする.プログラミング言語は修得の進度が顕著に現れる.なぜ,このような事象が生じるのか解明できれば,IT技術者の早期育成の一助となり,日本国内のIT人材不足を解消できると考えるからである.
|
Outline of Annual Research Achievements |
近年,実用的なITS(Intelligent Tutoring System)や,LMS(Learning Management System)が普及し,実際の教育現場でe-Learningシステムが活用されている.ITSやLMSによって,学生の試験結果や学習過程のログデータを保存することが容易になった.EDM(Educational Data Mining)では,これらの膨大な教育関連のデータから,いかにして意味のある情報を抜き出すかが研究の焦点となっており,ビッグデータ研究の発展に伴って近年急速に注目されている. 特に,本研究では,調査対象をプログラミング教育とし,ITS,LMSサーバに蓄積された膨大な試験結果と学習過程のログデータおよびソースコードから,時間変化するスキルの形成過程を可視化し,潜在的スキルダイナミクスを同定することを目的としている. これまでに我々は,初等プログラミングの授業で取得されたログデータとソースコードを解析し,授業に追従できていない学生の抽出を行う手法を提案した.また,学習者のモデル化である学生モデリング(Student Modeling)で一般的に用いられるKnowledge Tracingの拡張を行った.この提案手法では,Convex Factorization Machinesを適用することで凸最適化が可能となり,高速化と推定精度の向上が可能となった.当該年度では,推薦システムにおける代表的な CTR(Click Through Rate) 予測手法である Factorization Machinesをベースに,DNN(Deep Neural Network) を組み合わせたモデルである Deep Factorization Machinesを用いてモデルに組み込み,DNNベースのKTと精度の比較を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2020年度は新型コロナウイルスの感染予防対策のため,遠隔授業となった.そのため,これまでに構築したコンピュータ室での自動ログ取得システムを使用することができず,遠隔授業中の学生の振る舞いのデータは取得できなかった.予期せぬ事態となり,新しいデータの採取ができず研究の遂行が困難となることがあった.そこで,これまでに提案したConvex Factorization Machinesを用いた学生モデリング(Student Modeling)を,過去に取得済みの学生の授業時のソースコードに適用し,実験を行った.その結果,提案手法により,人工データのみならず,プログラミングのソースコードにおいても解答結果の予測精度が向上することがわかった. また,学生モデリング手法ではKT(Knowledge Tracing)が主流となっており,近年ではDKT(Deep Knowledge Tracing)やSAKT(Self-Attentive Knowledge Tracing)などのディープラーニングアプローチが盛んに研究されている.当該年度では,これらの手法に学習行動の履歴を用いたKTによる学生モデリングを行った. 新型コロナウイルスの感染予防のため,当初の計画通りデータ取得できないことがあったが,遠隔授業でもログや開発中のソースコードの採取ができるように自動取得システムの改良を達成した. また,当該年度はビデオ会議で国際会議が開催される学会に参加し,研究発表を行った.コロナパンデミックの状況も変化し,国際会議でなどで研究発表が容易になってきている.今年度も研究成果を発信していく予定である.
|
Strategy for Future Research Activity |
新型コロナウイルスの感染の状況が落ち着く傾向にあり,それに伴い規制も緩和されてきている.このコロナパンデミックにより,多くの会社や大学でテレワークや遠隔授業の重要性が認知された.新型コロナウイルスの感染拡大の前から,遠隔授業は行われた実績はあったが,それは限定的であった.しかし,対面授業ができず,遠隔授業を実施せざる得ない状況下となり,多種多様な形態の遠隔授業が大規模に行われた.遠隔授業の効果については賛否の意見がある.遠隔授業の効果を工学的なアプローチにより定量的に評価する必要があると考えている. 一方,教育ビジネスで大きな成長を遂げているものの多くはe-Learningである.また,今後,なんらかの事情(震災や他の疫病)で再度遠隔授業になる可能性もある.そこで,遠隔授業でも学生の振る舞いを取得し,学習効果やスキル修得過程などの可視化を行う研究は非常に重要となるであろう.また,現在多くの学校で遠隔授業を行っているが,その教育効果について工学的な手法による解析は不可欠である. また,ChatGPTのようなGenerative AIの急速な発展により,教育界にも多大な影響を与えることが予想される.教育の目的は,学生に知識や技術を身に付けさせることである.しかし,ChatGPTの使い方によってはレポートや課題の意味を成さなくなることもあろう.一方で,ChatGPTを使いこなすことができれば教育効果が高まることも予想される.そこで本研究で提案する時間変化するスキルの形成過程を可視化し,潜在的スキルダイナミクスを同定する手法により,ChatGPTのようなGenerative AIを学習者本人のスキル形成のために適切に使っているかどうかの判定も可能だと考える.今後は,潜在的スキルダイナミクスの同定と学習効果の可視化を教育効果を高めるための手法として適用することを考えていきたい.
|
Report
(4 results)
Research Products
(24 results)