教師採点データに拠らない深層学習に基づく記述式自動採点システムの開発

研究課題

研究課題/領域番号	20H04300
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
審査区分	小区分62030:学習支援システム関連
研究機関	独立行政法人大学入試センター
研究代表者	石岡恒憲独立行政法人大学入試センター, 研究開発部, 教授 (80311166)
研究分担者	中川正樹東京農工大学, 学内共同利用施設等, 特任教授 (10126295) 峯恒憲九州大学, システム情報科学研究院, 准教授 (30243851) 須鎗弘樹千葉大学, 大学院工学研究院, 教授 (70246685) 宮澤芳光独立行政法人大学入試センター, 研究開発部, 准教授 (70726166)
研究期間 (年度)	2020-04-01 – 2023-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	16,120千円 (直接経費: 12,400千円、間接経費: 3,720千円) 2022年度: 5,460千円 (直接経費: 4,200千円、間接経費: 1,260千円) 2021年度: 5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円) 2020年度: 5,460千円 (直接経費: 4,200千円、間接経費: 1,260千円)
キーワード	自然言語処理 / 自動採点 / 機械学習 / 深層学習 / トランスフォーマー / 手書き文字認識 / アンサンブル学習
研究開始時の研究の概要	センター試験など大学入試試験レベルの短答式記述試験の自動採点および人間による採点を支援する実用可能なシステムを試作・実装する。採点は設問ごとに作題者が用意した「模範解答」と「採点基準」に従いシステムがある程度の精度をもった採点計算（自動採点）を行うことを基本とし、その結果を人間が確認・修正できるものとする。このシステムの最大の特徴は「（予め用意された）模範解答」と「（被験者の実際の）記述解答」との意味的同一性や含意性の判定に採点済みの教師データを使わないことにある。予め別に用意された新聞や教科書、Wikipediaなど別のコーパスなどから自動構築した言語モデルによって判定を行う。
研究成果の概要	近年、自然言語での記述文を順番のある時系列データと見なし、これを入力データとして処理するリカレントニューラルネットワークと呼ばれる深層学習手法、特にバートなどのトランスフォーマーの研究が進み、その性能の良さが証明されてきた。そこで平成29年と30年に実施した共通テスト試行調査12万件による記述回答データを文字認識から一気通貫でバートによる自動採点までを行うことを試みた。我々の共同研究グループは、通常の採点システムが用いる人手による補助輪をしない実運用で平均96％，最低でも93％の一致率を確保した。また各問６万件という膨大なデータにより、深層学習に必要な標本サイズについても新たな知見を得た。
研究成果の学術的意義や社会的意義	いままでの研究では学習データに用いるサンプルはせいぜい２千件程度であり、どの程度のサンプルがあれば十分な予測ができるかの目安は与えられていなかった。さらに九大グループでは意味的埋め込みと呼ばれる異なったアプローチによる方法を試みた。これら結果については本科研で3件の学会表彰（日本計算機統計学会第35回大会, 学生研究発表賞；Duolingo Award for IMPS 2021；SMASH22 Winter Symposium,準優秀賞）を受け、その成果については日本教育新聞や日経新聞教育面に大きく掲載された。その後、教育工学のトップ国際会議AIED 2022でも論文採択された。

報告書

(4件)

研究成果
(17件)

すべて 2023 2022 2021 2020

すべて雑誌論文 (3件) (うち国際共著 3件、査読あり 3件) 学会発表 (13件) (うち招待講演 1件) 図書 (1件)

[雑誌論文] Optimizing Answer Representation using Metric Learning for Efficient Short Answer Scoring2023
- 著者名/発表者名
  Bo Wang, Billy Dawton, Tsunenori Ishioka and Tsunenori Mine
- 雑誌名
  
  The Pacific Rim International Conference on Artificial Intelligence (PRICAI)
  
  巻: 20th ページ: 236-248
- 関連する報告書
  2022 実績報告書
- 査読あり / 国際共著
[雑誌論文] Fully automated short answer scoring of the trial tests for common entrance examinations for japanese university2022
- 著者名/発表者名
  Oka, H., Nguyen, H. T., Nguyen, C. T., Nakagawa, M. & Ishioka, T.
- 雑誌名
  
  AIED 2022
  
  巻: LNCS 13355 ページ: 180-192
- DOI
  10.1007/978-3-031-11644-5_15
- ISBN
  9783031116438, 9783031116445
- 関連する報告書
  2022 実績報告書
- 査読あり / 国際共著
[雑誌論文] Handwriting recognition and automatic scoring for descriptive answers in japanese language tests, International Conference on Frontiers in Handwriting Recognition2022
- 著者名/発表者名
  Nguyen, H.T., Nguyen, C. T., Oka, H., Ishioka, T. & Nakagawa, M.
- 雑誌名
  
  International Conference on Frontiers in Handwriting Recognition, ICFHR 2022
  
  巻: LNCS 13639 ページ: 274-284
- 関連する報告書
  2022 実績報告書
- 査読あり / 国際共著
[学会発表] Automated Short Answer Grading with Rublic-based Semantic Embedding Optimization2022
- 著者名/発表者名
  Wang,B., Ishioka,T., Mine,T.
- 学会等名
  SMASH22 Winter Symposium
- 関連する報告書
  2022 実績報告書 2021 実績報告書 2020 実績報告書
[学会発表] Fully automatic scoring of handwritten descriptive answers in Japanese language tests2022
- 著者名/発表者名
  Nguyen, H.T., Nguyen, C. T., Oka, H., Ishioka, T. & Nakagawa, M.
- 学会等名
  IEICE technical report, PRMU2021-32, 45-50
- 関連する報告書
  2022 実績報告書
[学会発表] Visual constraints for generating multi-domain offline handwritten mathematical expressions2022
- 著者名/発表者名
  Ung, H. Q., Nguyen, C. T., Oka, H., Ishioka, T. & Nakagawa, M.
- 学会等名
  IEICE technical report, PRMU2021-69, 54-59
- 関連する報告書
  2022 実績報告書
[学会発表] 大学入学共通テスト試行調査における短答式記述答案の完全自動採点2022
- 著者名/発表者名
  岡知樹，N.T.Hung, N.TCuong, 中川正樹, 石岡恒憲
- 学会等名
  言語処理学会第28回年次大会, E3-5, 若手奨励賞
- 関連する報告書
  2021 実績報告書
[学会発表] Fully automatic scoring of handwritten descriptive answers in Japanese language tests2022
- 著者名/発表者名
  Hung Tuan Nguyen・Cuong Tuan Nguyen（TUAT）・Haruki Oka（UTokyo）・Tsunenori Ishioka（The National Center for University Entrance Examinations）・Masaki Nakagawa（TUAT）
- 学会等名
  電子情報通信学会研究会PRMU2021-32, 45-50.
- 関連する報告書
  2021 実績報告書
[学会発表] 大学入学共通テスト試行調査における短答式記述答案の完全自動採点2022
- 著者名/発表者名
  岡知樹，N.T.Hung, N.TCuong, 中川正樹, 石岡恒憲
- 学会等名
  言語処理学会第28回年次大会E3-5
- 関連する報告書
  2020 実績報告書
[学会発表] 大学入学共通テスト試行調査における記述式問題の自動採点2021
- 著者名/発表者名
  岡知樹，N.T.Hung, N.TCuong, 中川正樹, 石岡恒憲
- 学会等名
  日本計算機統計学会第35回大会, 学生研究発表賞
- 関連する報告書
  2021 実績報告書
[学会発表] Short answer scoring of the trial test for Japanese Common University Entrance Examination,2021
- 著者名/発表者名
  Oka,H., Hung,N.T., Cuong,N.T., Nakagawa,M., Ishioka,T.
- 学会等名
  IMPS, Duolingo Award
- 関連する報告書
  2021 実績報告書
[学会発表] 共通テストの試行調査国語記述解答データを用いた自動採点のアルゴリズムとその評価2021
- 著者名/発表者名
  石岡恒憲, 岡知樹, N.T.Hung, N.TCuong, 中川正樹
- 学会等名
  日本テスト学会第19回大会発表論文抄録集, 124－125.
- 関連する報告書
  2021 実績報告書
[学会発表] 大学入学共通テスト試行調査における記述式問題の自動採点2021
- 著者名/発表者名
  岡知樹，N.T.Hung, N.TCuong, 中川正樹, 石岡恒憲
- 学会等名
  日本計算機統計学会第35回大会
- 関連する報告書
  2020 実績報告書
[学会発表] 共通テストの試行調査国語記述解答データを用いた自動採点のアルゴリズムとその評価2021
- 著者名/発表者名
  石岡恒憲, 岡知樹, N.T.Hung, N.TCuong, 中川正樹
- 学会等名
  日本テスト学会第19回大会発表論文抄録集, pp.124－125
- 関連する報告書
  2020 実績報告書
[学会発表] 短答式試験における自動採点のための概念辞書を用いたデータ拡張手法の提案2021
- 著者名/発表者名
  加藤博之・石岡恒憲・峯恒憲
- 学会等名
  信学技報, vol. 120, no. 344, AI2020-15, pp. 7-12
- 関連する報告書
  2020 実績報告書
[学会発表] AI-based+ Automated Short-answer Scoring System2020
- 著者名/発表者名
  Ishioka, T.
- 学会等名
  Digital World 2020
- 関連する報告書
  2020 実績報告書
- 招待講演
[図書] 自動採点研究のこれから.「英語教育研究における自動採点　現状と課題」2020
- 著者名/発表者名
  石岡恒憲 (石井雄隆・近藤悠介(編))
- 総ページ数
  157
- 出版者
  ひつじ書房
- ISBN
  9784823410604
- 関連する報告書
  2020 実績報告書

教師採点データに拠らない深層学習に基づく記述式自動採点システムの開発

研究代表者

石岡 恒憲 独立行政法人大学入試センター, 研究開発部, 教授 (80311166)

16,120千円 (直接経費: 12,400千円、間接経費: 3,720千円)

報告書

研究成果

[雑誌論文] Optimizing Answer Representation using Metric Learning for Efficient Short Answer Scoring2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Fully automated short answer scoring of the trial tests for common entrance examinations for japanese university2022

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[雑誌論文] Handwriting recognition and automatic scoring for descriptive answers in japanese language tests, International Conference on Frontiers in Handwriting Recognition2022

著者名/発表者名

雑誌名

関連する報告書

[学会発表] Automated Short Answer Grading with Rublic-based Semantic Embedding Optimization2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Fully automatic scoring of handwritten descriptive answers in Japanese language tests2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Visual constraints for generating multi-domain offline handwritten mathematical expressions2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 大学入学共通テスト試行調査における短答式記述答案の完全自動採点2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Fully automatic scoring of handwritten descriptive answers in Japanese language tests2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 大学入学共通テスト試行調査における短答式記述答案の完全自動採点2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 大学入学共通テスト試行調査における記述式問題の自動採点2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] Short answer scoring of the trial test for Japanese Common University Entrance Examination,2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] 共通テストの試行調査国語記述解答データを用いた自動採点のアルゴリズムとその評価2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] 大学入学共通テスト試行調査における記述式問題の自動採点2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] 共通テストの試行調査国語記述解答データを用いた自動採点のアルゴリズムとその評価2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] 短答式試験における自動採点のための概念辞書を用いたデータ拡張手法の提案2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] AI-based+ Automated Short-answer Scoring System2020

著者名/発表者名

学会等名

関連する報告書

[図書] 自動採点研究のこれから.「英語教育研究における自動採点 現状と課題」2020

著者名/発表者名

総ページ数

出版者

ISBN

関連する報告書

石岡恒憲独立行政法人大学入試センター, 研究開発部, 教授 (80311166)

[図書] 自動採点研究のこれから.「英語教育研究における自動採点　現状と課題」2020