研究課題/領域番号 |
18K02882
|
研究機関 | 清泉女学院短期大学 |
研究代表者 |
片瀬 拓弥 清泉女学院短期大学, その他部局等, 准教授 (70542322)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 教師なし機械学習 / 教師あり機械学習 / 線形重回帰モデル / ニューラルネットワークモデル / クラスター中心からの距離 / GPA予測 / 学校生活満足度予測 |
研究実績の概要 |
平成30年度では、ラーニング・アナリティクスデータ(リメディアル教材LMSからの学習履歴)、性格特性、教学IRデータ(入試種別、出身高校偏差値、日本語プレースメントテストを活用し、1年春学期末のGPAと学校生活満足度の予測モデルを開発することを目的とした。ただし、モデル開発手法として、k-means法によるクラスター分析(教師なし機械学習)、線形重回帰モデル及びニューラルネットワークモデル(教師あり機械学習)を採用した。教師なし機械学習としてのk-means法によるクラスター分析は、①学習スタイル、②性格特性に分けて分析を行った。その結果、①では3つのクラスター、②では4つのクラスターにそれぞれ分類された。次にクラスター分析により分類された「学習スタイルと性格特性」について、ケース1(クラスター情報がダミー変数の場合)、ケース2(クラスター情報が各クラスター中心からの距離の場合)に分け、線形重回帰分析モデルとニューラルネットワークモデルによる教師あり機械学習を行った。それぞれの予測精度を計算した結果、線形重回帰モデルの最大決定係数は、(GPA,学校生活満足度)=(0.279,0.305)であり、ニューラルネットワークモデルの最大決定係数は、(GPA,学校生活満足度)=(0.831,0.479)となった。 最終的に平成30年度では、本研究テーマの重要ポイントである「モデル開発に必要な説明変数を概ね特定できたこと」、さらに「クラスター情報について、各クラスター中心からの距離を使った方が、2段階目の教師あり学習の精度が上がること」という開発手法を発見したことが成果といえる。次年度以降、さらにモデル精度の向上を図るため、新しい説明変数を探索する。そのため、対象学生に対して半構造化面接やアンケート調査等を行い、予測精度の向上とその予測による早期の学生対応方法を模索する。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成30年度では、本研究テーマの重要ポイントである「モデル開発に必要な説明変数を概ね特定できたこと」、さらに「クラスター情報について、各クラスター中心からの距離を使った方が、2段階目の教師あり学習の精度が上がること」という開発手法を発見したことが成果として挙げられる。よって、「おおむね順調に進展している」と考えている。 具体的には、本研究のようにクラスター分析を前段処理として活用することで、直接投入する説明変数の数を削減することができる。変数削減の代表的な手段としては「主成分分析」があるが、本研究のように「k-means法のクラスター分析による各クラスター中心からの距離」という方法もあることを示した。この方法の利点は、投入変数がいくら増えたとしても、分類されたクラスターは「パターン情報」という一次元に集約されることである。さらにニューラルネットワークモデルでは、一般的に投入する説明変数が多くなるほど予測精度は高くなる。しかし、その一方で計算過程はブラックボックスになりがちである。この点、本研究では、説明変数の意味解釈が容易なクラスター分析(教師なし機械学習)を前段処理に活用し、その後、線形重回帰モデル(教師あり機械学習)をもって予測モデルの概略をつかみ、その後、予測精度を向上させる目的でニューラルネットワークモデル(教師あり機械学習)を活用するモデルを開発したことになる。
|
今後の研究の推進方策 |
今後は、特に学生生活満足度の予測モデルの精度を向上させるため、新たな説明変数を探索する必要がある。そのため、学生たちを対象に半構造化面接やアンケート調査等を行い、予測精度の向上とその予測による早期の学生対応方法を模索していきたい。また、学生支援に対して新たな目的変数を見出すことで、実体的な学生支援に結びつけたいと考えている。また、新たにインターネット調査を追加し、モデル予測の向上や学習支援に寄与する質問紙を検討する。
|
次年度使用額が生じた理由 |
当初活用を予定していた質問紙について、研究機関の自費負担が決定したため、次年度使用額が生じた。しかし、次年度以降、新たにインターネット調査を実施し、モデル予測向上や学習支援策を調査する費用に当てる予定である。
|