研究課題/領域番号 |
16K01095
|
研究機関 | 木更津工業高等専門学校 |
研究代表者 |
大枝 真一 木更津工業高等専門学校, 情報工学科, 准教授 (80390417)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 教育データマイニング / 潜在スキル構造 / Q-matrix / プログラミング教育 / NMF / Skill Modeling / Student Modeling |
研究実績の概要 |
近年,実用的なITS(Intelligent Tutoring Systems)や,LMS(Learning Management Systems)が普及し,教育現場でeラーニングが活用されている.ITSやLMSによって,学生の試験結果や学習過程のログデータを保存することが容易になった.EDM(Educational Data Mining)では,これら膨大な教育関連のデータから,いかにして意味のある情報を抜き出すかが焦点となる研究分野であり,BigData研究の発展に伴って近年急速に注目されている. 本研究では,試験結果と学習過程のログデータから,知識を修得するために必要な潜在的スキル構造を自動抽出するデータマイニング技術を開発する.対象は教育データとしている.EDMの分野では,試験結果から設問とスキルの関係を抽出するSkill Modelingと呼ばれる研究が行われている.特に,我々は試験結果行列RをNMF(Non-negative Matrix Factorization)を用いて,行列QとSに因子分解する手法を提案した.行列QはQ-matrixと呼ばれ,どの設問を解くには,どのスキルが必要かを表した関係行列となっている. しかし,我々を含めた従来の研究では,学習中のログデータを使用してはいなかった.そこで学習過程も考慮することで,より精度の高い潜在スキル構造の抽出を試みる.学習中に記録されるログデータには,スキルが反映されているものや,そうでないものもあるため,ログデータからスキルに関連する規則性を発見するために機械学習を用いた新しい教育データマイニング手法を開発する. 今年度の実績としては,Knowledge Tracingの代わりにFactorization Machinesを用いた手法の提案を行った.また,プログラミング授業のログデータの可視化を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
試験結果とともに,プログラミング授業中のログデータを解析するために,可視化ツールを作成した.これにより,どの学生が授業について来れていないか,授業中に把握することが可能となった.プログラミング授業で採取するログデータはUNIXコマンドの入力数,コンパイル時のソースコードの変量であり,これらを統合する手法の開発を行った. また,過去の試験結果データから,どの学生がどの問題に解答できるか,出来ないかを識別する手法は,適切な問題を出題するために重要になる.これは,Student Modelingと呼ばれる手法であり,従来は隠れマルコフモデルを基盤としたKnowledge Tracingを用いることが一般的であった.これに対し,我々はFactorization Machinesを用いて,精度を向上させる手法を考案した. これらのことから概ね順調であると判断した.
|
今後の研究の推進方策 |
ログデータの採取方法として,新たに一定間隔で自動的にソースコードを取得する手法の開発を行う.また,取得したデータから,プログラミングが得意な学生と,そうでない学生の特徴を抽出することを試みる.試験結果行列には欠損が生じるが,欠損がある場合でも対応が可能なNMFの開発を行う.
|
次年度使用額が生じた理由 |
取得したログデータが膨大となるため,演算に用いる高速計算機サーバを購入する予定であった.しかし,当初の計画よりもデータの蓄積率が低かったため,現在使用しているPCでもどうにか演算が可能であった.コンピュータの性能は後に発売されるほど良くなるので,購入を次年度に持ち越した.研究への影響はない.今年度,高速計算機サーバ,データ解析用PCを購入する.
|