• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

項目反応理論に基づくパフォーマンス評価フレームワークの開発と実証実験

Research Project

Project/Area Number 21H00898
Allocation TypeSingle-year Grants
Research InstitutionThe University of Electro-Communications

Principal Investigator

宇都 雅輝  電気通信大学, 大学院情報理工学研究科, 准教授 (10732571)

Project Period (FY) 2021-04-01 – 2025-03-31
Keywordsパフォーマンス評価 / ベイズ統計 / テスト理論 / 人工知能 / 自然言語処理
Outline of Annual Research Achievements

パフォーマンス評価の信頼性を改善する手法の一つとして,評価者のバイアスを取り除いて受検者の能力を推定できる項目反応モデルが知られている.しかし,このような項目反応モデルを現実の試験で継続的・効果的に運用するためにはいくつかの問題が残る.本研究では,このような項目反応モデルを継続的・効果的に運用するための手法群として,1)適切な評価デザインの自動設計手法,2)項目反応モデルから得られる様々な統計情報に基づく分析レポートの自動生成手法,3)補助情報を活用したモデル・パラメータ推定精度改善手法,を開発するとともに,それらを統合した評価フレームワークの開発を目指す.
この目標に対し,令和4年度には,令和3年度に開発した各要素技術を発展させた.1)については,令和3年度に検討した医療系大学間共用試験OSCEの適切な評価者割当デザインに従ったデータを利用し,項目反応モデルの適用実験を行った.分析結果は,医療系大学間共用試験の試験信頼性妥当性検討委員会と全国説明会で報告した.2)に関しては,項目反応理論と大規模言語モデルの様々な統合技術を開発し,項目反応モデルの解釈とその言語的な説明について検討を進めた.研究成果は,電子情報通信学会論文誌に掲載され,言語処理分野の難関国際会議COLINGにもフルペーパで採択された.また,教育システム情報学会 論文賞・全国大奨励賞,日本テスト学会 大会発表賞などを受賞した.3)については,評価者特性に加えて,ルーブリックやテスト問題の特性も考慮して多次元的な尺度上で受験者の能力を評価できる項目反応モデルと評価者特性が時間変化する評価者特性ドリフトと呼ばれる現象を捉えたモデルを開発し,評価者特性な多様な分析を実現した.研究成果は,査読付き国際論文誌Behavior Research Methodsに採択され,国内学会では,教育システム情報学会 優秀研究賞を受賞した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

上述の通り,本研究の要素技術となる3つの技術それぞれについて順調に研究が進行しており,前年度に引き続き研究業績も多数発表している.このことから,おおむね順調に進展していると評価した.

Strategy for Future Research Activity

令和5年度には,本研究で開発を目指すパフォーマンス評価フレームワークの要素技術として研究してきた技術を引き続き発展させるとともに,それらを用いた実証実験を進める.実証実験としては,医療系大学間共用試験OSCEにおいてリンケージ可能な評価者割り当てデザインで収集された実際の評点データに対して我々の開発してきた項目反応モデルを適用し,結果として得られる評価者特性値に基づいて分析レポートを自動生成し,各組織にフィードバックするという実践を行う.なお,分析レポートの自動作成手法(項目反応モデルから得られる様々な統計情報から有益な情報を抽出し,その情報をdata-to-text技術を用いて非専門家にも理解しやすい形式に変換して出力する手法)は現在も開発中であるため,引き続き基礎技術の開発も進める.同様に,本研究の基礎技術の一つである,評価者特性の効率的な推定手法(評価者の属性情報や心理尺度,採点時間などの様々な補助情報を活用して実現)についても引き続き開発と評価を進める.また,得られた研究成果は適宜発表していく.

  • Research Products

    (23 results)

All 2023 2022

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 1 results) Presentation (20 results) (of which Int'l Joint Research: 1 results,  Invited: 2 results)

  • [Journal Article] 多次元項目反応理論と深層学習を用いた複数観点同時自動採点手法2023

    • Author(s)
      柴田 拓海、宇都 雅輝
    • Journal Title

      電子情報通信学会論文誌D 情報・システム

      Volume: J106-D Pages: 47~56

    • DOI

      10.14923/transinfj.2022JDP7007

    • Peer Reviewed
  • [Journal Article] ルーブリックを用いたパフォーマンス評価のための多次元4相型項目反応モデル2022

    • Author(s)
      宇都 雅輝
    • Journal Title

      電子情報通信学会論文誌D 情報・システム

      Volume: J105-D Pages: 457~469

    • DOI

      10.14923/transinfj.2021JDP7042

    • Peer Reviewed
  • [Journal Article] A Bayesian many-facet Rasch model with Markov modeling for rater severity drift2022

    • Author(s)
      Uto Masaki
    • Journal Title

      Behavior Research Methods

      Volume: - Pages: -

    • DOI

      10.3758/s13428-022-01997-z

    • Peer Reviewed / Open Access
  • [Presentation] Analytic Automated Essay Scoring based on Deep Neural Networks Integrating Multidimensional Item Response Theory2022

    • Author(s)
      Takumi Shibata, Masaki Uto
    • Organizer
      International Conference on Computational Linguistics
    • Int'l Joint Research
  • [Presentation] 小論文の分析的評価のための項目反応理論を用いた深層学習自動採点手法2022

    • Author(s)
      柴田拓海,宇都雅輝
    • Organizer
      教育システム情報学会第47回全国大会
  • [Presentation] 深層学習を用いた難易度調整機能付き読解問題自動生成手法2022

    • Author(s)
      鈴木彩香,宇都雅輝
    • Organizer
      教育システム情報学会第47回全国大会
  • [Presentation] 評価者の厳しさの時間変化を検出する時系列型ベイズ多相ラッシュモデル2022

    • Author(s)
      宇都雅輝,林真由
    • Organizer
      教育システム情報学会第47回全国大会
  • [Presentation] 難易度調節可能な読解問題自動生成のための深層学習手法2022

    • Author(s)
      鈴木彩香,宇都雅輝
    • Organizer
      日本テスト学会第20回大会
  • [Presentation] 多次元項目反応理論を組み込んだ深層学習モデルに基づく小論文の観点別自動採点手法2022

    • Author(s)
      柴田拓海,宇都雅輝
    • Organizer
      日本テスト学会第20回大会
  • [Presentation] 評価者特性ドリフトを検出する時系列型ベイズ多相ラッシュモデル2022

    • Author(s)
      宇都雅輝,林真由
    • Organizer
      日本テスト学会第20回大会
  • [Presentation] 深層学習自動採点技術を用いた一般化多相ラッシュモデルの等化手法2022

    • Author(s)
      荒巻洸太,宇都雅輝
    • Organizer
      行動計量学会第50回大会
  • [Presentation] Transformerモデルを用いた難易度調節機能付き読解問題自動生成手法2022

    • Author(s)
      鈴木彩香,宇都雅輝
    • Organizer
      行動計量学会第50回大会
  • [Presentation] 深層学習と多次元項目反応理論を用いた小論文の観点別自動採点2022

    • Author(s)
      柴田拓海,宇都雅輝
    • Organizer
      行動計量学会第50回大会
  • [Presentation] 評価者特性の時間変動を推定する時系列型ベイズ多相ラッシュモデル2022

    • Author(s)
      宇都雅輝,林真由
    • Organizer
      行動計量学会第50回大会
  • [Presentation] ルーブリックを用いたライティング評価のための多次元項目反応モデル2022

    • Author(s)
      宇都雅輝
    • Organizer
      第21回情報科学技術フォーラム
    • Invited
  • [Presentation] 論述構造解析を組み込んだニューラル小論文自動採点手法2022

    • Author(s)
      山浦美里,福田樹,宇都雅輝
    • Organizer
      人工知能学会 第96回 先進的学習科学と工学研究会
  • [Presentation] 歯学系臨床実習前OSCEの評価者の評価におけるIRT利用について2022

    • Author(s)
      宇都雅輝
    • Organizer
      試験信頼性妥当性検討委員会第 22 回講演会
    • Invited
  • [Presentation] 読解対象文の難易度を考慮した読解問題自動生成手法2022

    • Author(s)
      富川雄斗,宇都雅輝
    • Organizer
      教育システム情報学会学生研究発表会
  • [Presentation] アンサンブル法に基づく深層学習自動採点の不確かさ推定2022

    • Author(s)
      高橋祐斗,宇都雅輝
    • Organizer
      教育システム情報学会学生研究発表会
  • [Presentation] 項目反応理論と深層学習を用いた難易度調節可能な読解問題自動生成手法2022

    • Author(s)
      鈴木彩香,宇都雅輝
    • Organizer
      人工知能学会 第97回先進的学習科学と工学研究会
  • [Presentation] 項目反応理論に基づく難易度調節可能な読解問題自動生成手法2022

    • Author(s)
      鈴木彩香,宇都雅輝
    • Organizer
      言語処理学会第29回年次大会
  • [Presentation] 論述構造解析技術を用いたニューラル小論文自動採点手法2022

    • Author(s)
      山浦美里,福田樹,宇都雅輝
    • Organizer
      言語処理学会第29回年次大会
  • [Presentation] 多次元項目反応理論と深層学習に基づく複数観点同時自動採点手法の精度改善2022

    • Author(s)
      柴田拓海,宇都雅輝
    • Organizer
      言語処理学会第29回年次大会

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi