2023 年度実績報告書

項目反応理論に基づくパフォーマンス評価フレームワークの開発と実証実験

研究課題

研究課題/領域番号	21H00898
配分区分	補助金
研究機関	電気通信大学
研究代表者	宇都雅輝電気通信大学, 大学院情報理工学研究科, 准教授 (10732571)
研究期間 (年度)	2021-04-01 – 2025-03-31
キーワード	パフォーマンス評価 / ベイズ統計 / テスト理論 / 人工知能 / 自然言語処理
研究実績の概要	パフォーマンス評価の信頼性を改善する手法の一つとして，評価者のバイアスを取り除いて受検者の能力を推定できる項目反応モデルが知られている．しかし，このような項目反応モデルを現実の試験で継続的・効果的に運用するためにはいくつかの問題が残る．本研究では，このような項目反応モデルを継続的・効果的に運用するための手法群として，1)適切な評価デザインの設計手法，2)自然言語処理技術を活用してモデルの解釈性を高める手法，3)補助情報を活用したモデル・パラメータ推定精度改善手法，を開発する．この目標に対し，令和5年度には，令和4年度までに開発した各要素技術の発展や実運用を行なった．1)については，医療系大学間共用試験OSCEにおいて適切な評価者割当デザインに沿ったデータを収集し，そのデータに対して項目反応モデルを適用する実践を行った．分析結果は，医療系大学間共用試験の試験信頼性妥当性検討委員会や全国説明会で報告した．さらに，東京医科歯科大学のOSCEでも同様に適切なデザインでの実践を行い，そのデータを用いた分析・評価を行なった．この成果は現在医学系論文誌に投稿中である．2)に関連する研究としては，項目反応理論を用いて複数の自動採点モデルをアンサンブルする手法や，文章の論理構造を解析する論述構造解析技術を自動採点モデルに組み込んで解釈性を高めた手法などを開発した．研究成果は，分野のトップジャーナルであるIEEE TLTに採択され，トップ国際会議であるAIEDにもフルペーパ論文が採択された．また，人工知能学会や教育システム情報学会などの複数の国内学会で受賞した．3)については，記述回答のテキスト情報を加味して項目反応モデルのパラメータ推定を高精度に行う手法を開発した．研究成果は，査読付き国際会議IMPSで発表し，人工知能学会や言語処理学会などの国内学会でも発表した．
現在までの達成度 (区分)	現在までの達成度 (区分) 1: 当初の計画以上に進展している理由上述の通り，本研究のそれぞれの要素技術について順調に研究が進行しており，前年度に引き続き研究業績も多数発表している．さらに次項に示す通り，令和6年度には当初予定にない発展的な課題にも取り組む想定である．以上から，「当初の計画以上に進展している」と評価した．
今後の研究の推進方策	令和6年度には，本研究課題で開発してきたパフォーマンス評価フレームワークの要素技術を引き続き発展させるとともに，それらの成果を取りまとめて国内外の様々な学会・論文誌で発表していく．発展技術としては，1）一般的なリンケージ手法を適用できないデータ収集デザインであっても，自動採点技術を応用することでリンケージできるようにする手法，2）大規模言語モデルを応用することで，問題文の情報から項目特性値（識別力や難易度）を予測する技術，3）大規模言語モデルと項目反応理論を融合することで，所望の項目特性の問題を自動生成する手法などの開発を目指す．これらは元々の研究計画にはなかった内容であるが，本研究課題の進展と近年の飛躍的な自然言語処理技術の発展に伴い実現可能性が高まってきたものである．上述の通り，本研究課題については当初計画に沿った十分な成果が出ているため，最終年度にはこれらの発展的な課題にも挑戦していく．なお当初予定の研究計画に対する研究成果は，最終成果物を英文のハイインパクトな査読付き論文誌を中心に投稿していく．それと同時に，上述した発展技術についても研究成果を発表できるように進めていく．

研究成果
(27件)

すべて 2024 2023

すべて雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 1件) 学会発表 (25件) (うち国際学会 4件、招待講演 1件)

[雑誌論文] 項目反応理論に基づく難易度調整可能な読解問題自動生成手法2024
- 著者名/発表者名
  富川雄斗、鈴木彩香、宇都雅輝
- 雑誌名
  
  電子情報通信学会論文誌D 情報・システム
  
  巻: J107-D ページ: 53～66
- DOI
  10.14923/transinfj.2023JDP7028
- 査読あり
[雑誌論文] Integration of Prediction Scores From Various Automated Essay Scoring Models Using Item Response Theory2023
- 著者名/発表者名
  Uto Masaki、Aomi Itsuki、Tsutsumi Emiko、Ueno Maomi
- 雑誌名
  
  IEEE Transactions on Learning Technologies
  
  巻: 16 ページ: 983～1000
- DOI
  10.1109/TLT.2023.3253215
- 査読あり / オープンアクセス
[学会発表] 質問応答システムに基づく解答可能性改善機構を組み込んだ読解問題自動生成手法2024
- 著者名/発表者名
  鈴木彩香，宇都雅輝
- 学会等名
  人工知能学会第100回先進的学習科学と工学研究会
[学会発表] 回帰と分類の多出力深層学習モデルに基づく論述回答自動採点の得点予測と確信度推定の高精度化2024
- 著者名/発表者名
  高橋祐斗，宇都雅輝
- 学会等名
  人工知能学会第100回先進的学習科学と工学研究会
[学会発表] ChatGPTの過剰回答を抑制する機構を組み込んだ医療面接試験向け仮想模擬患者2024
- 著者名/発表者名
  進藤尚希，宇都雅輝
- 学会等名
  人工知能学会第100回先進的学習科学と工学研究会
[学会発表] 項目反応理論を用いた難易度調整可能な多肢選択式読解問題自動生成2024
- 著者名/発表者名
  富川雄斗，宇都雅輝
- 学会等名
  言語処理学会第30回年次大会
[学会発表] 確信度と得点の予測精度を両立する論述回答自動採点モデル2024
- 著者名/発表者名
  高橋祐斗，宇都雅輝
- 学会等名
  言語処理学会第30回年次大会
[学会発表] 自動採点技術と項目反応理論に基づくテスト等化を通じた論述式回答評価の高精度化2024
- 著者名/発表者名
  荒巻洸太，宇都雅輝
- 学会等名
  言語処理学会第30回年次大会
[学会発表] ChatGPTの過剰回答に対する自己フィードバック機構を組み込んだ医療面接試験向け仮想模擬患者2024
- 著者名/発表者名
  進藤尚希，宇都雅輝
- 学会等名
  言語処理学会第30回年次大会
[学会発表] 文章変換技術に基づくデータ拡張を用いた問題横断型自動採点手法2024
- 著者名/発表者名
  伊藤佑真，宇都雅輝
- 学会等名
  教育システム情報学会学生研究発表会
[学会発表] 問題と模範解答を同時に生成する難易度調整機能付き読解問題自動生成手法2024
- 著者名/発表者名
  後藤照佳，富川雄斗，宇都雅輝
- 学会等名
  教育システム情報学会学生研究発表会
[学会発表] 解答可能性の評価機構を組み込んだ難易度調節可能な読解問題自動生成手法2024
- 著者名/発表者名
  鈴木彩香，宇都雅輝
- 学会等名
  電子情報通信学会教育工学研究会
[学会発表] ChatGPTの過剰解答に対するフィードバック機構を組み込んだ客観的臨床能力試験のためのシナリオ対話AI2024
- 著者名/発表者名
  進藤尚希，宇都雅輝
- 学会等名
  電子情報通信学会教育工学研究会
[学会発表] 歯学生臨床実習前OSCEの評価者の評価におけるIRT利用について2024
- 著者名/発表者名
  宇都雅輝
- 学会等名
  試験信頼性妥当性検討委員会第24回講演会
- 招待講演
[学会発表] Difficulty-Controllable Neural Question Generation for Reading Comprehension using Item Response Theory2023
- 著者名/発表者名
  Masaki Uto, Yuto Tomikawa, Ayaka Suzuki
- 学会等名
  18th Workshop on Innovative Use of NLP for Building Educational Applications
- 国際学会
[学会発表] Neural automated essay scoring considering logical structure2023
- 著者名/発表者名
  Misato Yamaura, Itsuki Fukuda, Masaki Uto
- 学会等名
  24th International Conference on Artificial Intelligence in Education
- 国際学会
[学会発表] Neural Automated Short-Answer Grading Considering Examinee-Specific Features2023
- 著者名/発表者名
  Masaki Uto
- 学会等名
  23rd IEEE International Conference on Advanced Learning Technologies
- 国際学会
[学会発表] Linking method for writing tests using item response theory and automated essay scoring2023
- 著者名/発表者名
  Kota Aramaki, Masaki Uto
- 学会等名
  International Meeting of the Psychometric Society
- 国際学会
[学会発表] ドメイン調整可能な文章変換技術を用いた問題横断型自動採点手法2023
- 著者名/発表者名
  伊藤佑真，宇都雅輝
- 学会等名
  人工知能学会第99回先進的学習科学と工学研究会
[学会発表] 回帰と分類のマルチタスク学習を適用した深層学習自動採点の不確かさ推定2023
- 著者名/発表者名
  高橋祐斗，宇都雅輝
- 学会等名
  電子情報通信学会教育工学研究会
[学会発表] 問題と模範解答の同時生成機構を持つ難易度調整可能な読解問題自動生成手法2023
- 著者名/発表者名
  後藤照佳，富川雄斗，宇都雅輝
- 学会等名
  電子情報通信学会教育工学研究会
[学会発表] 読解対象文の難易度を考慮した読解問題自動生成手法2023
- 著者名/発表者名
  富川雄斗，宇都雅輝
- 学会等名
  教育システム情報学会第48回全国大会
[学会発表] 評価者特性を考慮した項目反応モデルと深層学習自動採点技術に基づく記述式テストの等化手法2023
- 著者名/発表者名
  荒巻洸太，宇都雅輝
- 学会等名
  日本テスト学会第21回大会
[学会発表] オンライン授業での論述テキストによる学習者特性の推定に関する一検討2023
- 著者名/発表者名
  中山実，宇都雅輝，菊池聡，山本洋雄
- 学会等名
  電子情報通信学会教育工学研究会
[学会発表] 深層学習自動採点技術と項目反応理論を用いた記述，論述式テストの等化手法2023
- 著者名/発表者名
  荒巻洸太，宇都雅輝
- 学会等名
  第37回人工知能学会全国大会
[学会発表] 深層学習と項目反応理論を用いた難易度調節可能な読解問題自動生成手法2023
- 著者名/発表者名
  鈴木彩香，宇都雅輝
- 学会等名
  第37回人工知能学会全国大会
[学会発表] 論述構造解析を用いたニューラル小論文自動採点手法の提案2023
- 著者名/発表者名
  山浦美里，福田樹，宇都雅輝
- 学会等名
  第37回人工知能学会全国大会

2023 年度 実績報告書

項目反応理論に基づくパフォーマンス評価フレームワークの開発と実証実験

研究代表者

宇都 雅輝 電気通信大学, 大学院情報理工学研究科, 准教授 (10732571)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] 項目反応理論に基づく難易度調整可能な読解問題自動生成手法2024

著者名/発表者名

雑誌名

DOI

[雑誌論文] Integration of Prediction Scores From Various Automated Essay Scoring Models Using Item Response Theory2023

著者名/発表者名

雑誌名

DOI

[学会発表] 質問応答システムに基づく解答可能性改善機構を組み込んだ読解問題自動生成手法2024

著者名/発表者名

学会等名

[学会発表] 回帰と分類の多出力深層学習モデルに基づく論述回答自動採点の得点予測と確信度推定の高精度化2024

著者名/発表者名

学会等名

[学会発表] ChatGPTの過剰回答を抑制する機構を組み込んだ医療面接試験向け仮想模擬患者2024

著者名/発表者名

学会等名

[学会発表] 項目反応理論を用いた難易度調整可能な多肢選択式読解問題自動生成2024

著者名/発表者名

学会等名

[学会発表] 確信度と得点の予測精度を両立する論述回答自動採点モデル2024

著者名/発表者名

学会等名

[学会発表] 自動採点技術と項目反応理論に基づくテスト等化を通じた論述式回答評価の高精度化2024

著者名/発表者名

学会等名

[学会発表] ChatGPTの過剰回答に対する自己フィードバック機構を組み込んだ医療面接試験向け仮想模擬患者2024

著者名/発表者名

学会等名

[学会発表] 文章変換技術に基づくデータ拡張を用いた問題横断型自動採点手法2024

著者名/発表者名

学会等名

[学会発表] 問題と模範解答を同時に生成する難易度調整機能付き読解問題自動生成手法2024

著者名/発表者名

学会等名

[学会発表] 解答可能性の評価機構を組み込んだ難易度調節可能な読解問題自動生成手法2024

著者名/発表者名

学会等名

[学会発表] ChatGPTの過剰解答に対するフィードバック機構を組み込んだ客観的臨床能力試験のためのシナリオ対話AI2024

著者名/発表者名

学会等名

[学会発表] 歯学生臨床実習前OSCEの評価者の評価におけるIRT利用について2024

著者名/発表者名

学会等名

[学会発表] Difficulty-Controllable Neural Question Generation for Reading Comprehension using Item Response Theory2023

著者名/発表者名

学会等名

[学会発表] Neural automated essay scoring considering logical structure2023

著者名/発表者名

学会等名

[学会発表] Neural Automated Short-Answer Grading Considering Examinee-Specific Features2023

著者名/発表者名

学会等名

[学会発表] Linking method for writing tests using item response theory and automated essay scoring2023

著者名/発表者名

学会等名

[学会発表] ドメイン調整可能な文章変換技術を用いた問題横断型自動採点手法2023

著者名/発表者名

学会等名

[学会発表] 回帰と分類のマルチタスク学習を適用した深層学習自動採点の不確かさ推定2023

著者名/発表者名

学会等名

[学会発表] 問題と模範解答の同時生成機構を持つ難易度調整可能な読解問題自動生成手法2023

著者名/発表者名

学会等名

[学会発表] 読解対象文の難易度を考慮した読解問題自動生成手法2023

著者名/発表者名

学会等名

[学会発表] 評価者特性を考慮した項目反応モデルと深層学習自動採点技術に基づく記述式テストの等化手法2023

著者名/発表者名

学会等名

[学会発表] オンライン授業での論述テキストによる学習者特性の推定に関する一検討2023

著者名/発表者名

2023 年度実績報告書

宇都雅輝電気通信大学, 大学院情報理工学研究科, 准教授 (10732571)