研究課題/領域番号 |
18K02886
|
研究機関 | 大阪府立大学工業高等専門学校 |
研究代表者 |
和田 健 大阪府立大学工業高等専門学校, その他部局等, 准教授 (00469587)
|
研究分担者 |
早川 潔 大阪府立大学工業高等専門学校, その他部局等, 教授 (20325575)
谷野 圭亮 大阪府立大学工業高等専門学校, その他部局等, 講師 (70778589)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | ラーニングアナリティクス / 答案分析 / データ分析前処理 / 教育工学 / 機械学習 |
研究実績の概要 |
本年度は採点済みの答案から採点情報、つまり、個別の問題に対する採点マーク(教員が赤ペンでつけたマルやバツなどの採点記号)を自動読み取りするためのソフトウェアの設計と実装に取り組んだ。赤ペンによって直接書き込まれた採点マークの認識は、一般には画像を対象とした多クラス分類問題に属する。このようなタスクに対しては、CNN(Convolutional Neural Network)による深層学習が有効であることが知られている。しかし、そのためには画像に対する適切な前処理が必要であり、本研究の場合、それは答案紙面から各設問に対応した採点記号だけを抽出することに相当する。前年度までの研究成果によって、答案を設問ごとに分離することは可能となっている。しかし、そこには採点マークのほかに、解答欄の枠、問題番号、学生解答などが含まれ、アスペクト比やサイズも一定ではないため、そのままではCNNの入力とはできない。そこで、そこから採点マークのみを抽出した画像を生成する処理を検討した。具体的には、予備実験を通じて、マル、バツ、三角のような8種の採点マークに対して、28×28の8bitグレーススケールでデータを準備すれば、CNNを適用して正解率98%以上でクラス分類できることを確認した。そして、アスペクト比とサイズ不定の画像から、採点マークを抽出する画像処理法(確率的ハフ変換を利用した枠線除去、色情報に基づく情報の抽出、拡張・収縮等によるノイズ除去などを組み合わせた手法)を考案、実装、評価した。そして、実際の採点済み答案において、提案する前処理と細かなチューニングなしのCNNを用いて95%以上の正解率でのクラス分類ができることを確認した。これらの成果について学会発表した。また、答案分析支援システムを学会発表聴講者ならびに学内関係者限定で配付・公開し、システムの機能面・性能面の課題について明らかにした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究は、記述式筆記試験の答案をデータソースとして、ラーニングアナリティクスの観点からデータ分析するために必要な「前処理プロセス」について明らかにし、この前処理プロセスを効率化/省力化するための答案分析支援システムを開発することを目的としている。これまでに、支援システム(各種ツールセット)として、(1) スキャンされた答案画像と学籍番号などの学生情報を紐づけるツール、(2) スキャン時に生じる画像の傾きや位置ズレを自動調整するツール、(3) 範囲(解答欄領域)を指定して複数答案画像に対して一括トリミングをかけるツール、(4) 解答欄単位に分離された画像に対して「正答」「誤答」「有効数字のミス」「計算ミス」のような任意の属性情報を付与してCSV・JSON等の汎用データ形式で出力するツール、(5) 採点マークから採点情報を自動読み取りするツールを開発した。また、これらを利用し、試験問題の正誤を観測事象として学習到達目標の達成度合いをベイズ推定する手法についても考案・評価した。 しかし、新型コロナウイルス感染症による影響で、定期試験が中止となったり、ウェブベースの試験に形式移行するなどの影響があり、当初予定していたような複数の定期試験・小テストを組み合わせた答案分析のケーススタディについては十分に実施できていない。以上のことから、本研究の進捗状況としてやや遅れていると判断した。
|
今後の研究の推進方策 |
本研究の目的である「答案分析の前処理プロセスを効率化/省力化するための答案分析支援システム」の開発について、当初計画していた機能は各種ツールとして90%ほど設計と実装を終えており、今後は、利用者からのフィードバックをもらいながら、より使いやすいものに改良を進め、広く一般にも公開する。また、画像処理技術を利用した採点マークの読み取りに関しては、精度向上の余地があるため、それについて分担者とともに取り組む。また、採点マークの読み取りを通じて、記号解答(ア・イ・ウ・エなどの記号選択解答)についても読み取り可能であることが分かったので、それについても取り組みを進める。 また、これまでにシステムを利用して実施した答案分析を通じて、一般的に要求される分析項目、指標・チャート、また、その作業フローについての知見が得られた。これらを利用して答案分析作業のためのテンプレートを作成・評価する。
|
次年度使用額が生じた理由 |
新型コロナウイルスの感染拡大により、2020年度以降、国内外の学会の中止やオンライン開催が増加し、想定していた旅費や登壇料への支出が大幅に少なくなった。これらは、今後、オンライン開催を含めた国内学会の登壇料、物品費として使用する予定である。また、システム開発やデータ分析の資料として書籍等の物品、ツール開発評価用にPC等を購入予定であったが、研究進捗状況にあわせて必要なものを厳選した結果、交付申請時の想定よりも支出が少なくなった。これらは今後の物品購入にあてる。
|