研究課題/領域番号 |
20H04300
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分62030:学習支援システム関連
|
研究機関 | 独立行政法人大学入試センター |
研究代表者 |
石岡 恒憲 独立行政法人大学入試センター, 研究開発部, 教授 (80311166)
|
研究分担者 |
中川 正樹 東京農工大学, 学内共同利用施設等, 特任教授 (10126295)
峯 恒憲 九州大学, システム情報科学研究院, 准教授 (30243851)
須鎗 弘樹 千葉大学, 大学院工学研究院, 教授 (70246685)
宮澤 芳光 独立行政法人大学入試センター, 研究開発部, 准教授 (70726166)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
16,120千円 (直接経費: 12,400千円、間接経費: 3,720千円)
2022年度: 5,460千円 (直接経費: 4,200千円、間接経費: 1,260千円)
2021年度: 5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円)
2020年度: 5,460千円 (直接経費: 4,200千円、間接経費: 1,260千円)
|
キーワード | 自然言語処理 / 自動採点 / 機械学習 / 深層学習 / 手書き文字認識 / アンサンブル学習 |
研究開始時の研究の概要 |
センター試験など大学入試試験レベルの短答式記述試験の自動採点および人間による採点を支援する実用可能なシステムを試作・実装する。採点は設問ごとに作題者が用意した「模範解答」と「採点基準」に従いシステムがある程度の精度をもった採点計算(自動採点)を行うことを基本とし、その結果を人間が確認・修正できるものとする。このシステムの最大の特徴は「(予め用意された)模範解答」と「(被験者の実際の)記述解答」との意味的同一性や含意性の判定に採点済みの教師データを使わないことにある。予め別に用意された新聞や教科書、Wikipediaなど別のコーパスなどから自動構築した言語モデルによって判定を行う。
|
研究実績の概要 |
本科研はセンター試験など大学入試レベルの短答式記述試験の自動採点および人間による採点を支援する実用可能なシステムを試作・実装することを目的とする。採点は設問ごとに作題者が用意した「模範解答」と「採点基準」に従いシステムがある程度(90%以上程度)の精度をもった採点計算(自動採点)を行うことを目標とする。 本科研では手書き文字解答から自動採点までを一気通貫で行い、人手を一切用いない方法での性能を評価した。つまり機械にタグ付けのルールを教え込むといった理解の補助輪を一切用いずに、実運用で平均96%、最低でも93%の一致率を確保した。また各問6万件という膨大なデータにより、深層学習に必要な標本サイズにおいても新たな知見を得た。言語モデルには当時の世界最先端であるBERT を用いた。その成果については多くの学会賞(日本計算機統計学会第35回大会, 学生研究発表賞;Duolingo Award for IMPS 2021;SMASH22 Winter Symposium,準優秀賞;言語処理学会第28回年次大会, 若手奨励賞)を受け、また教育工学のトップカンファレンスであるAIED等の国際会議で採択された。日経新聞教育面には2,000字の寄稿が掲載された。 本科研は当初の目的を概ね達成し、今年度(令和5年度)に新規に採択された科研費研究(基盤B)において、その発展的内容を継続して実施している。
|
現在までの達成度 (段落) |
令和4年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和4年度が最終年度であるため、記入しない。
|