• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

スピーキング評価における評価の厳しさ変動を観測し信頼性を高める方法

研究課題

研究課題/領域番号 24K00079
研究種目

基盤研究(B)

配分区分基金
応募区分一般
審査区分 小区分02100:外国語教育関連
研究機関福島大学

研究代表者

横内 裕一郎  福島大学, 経済経営学類, 准教授 (40782800)

研究分担者 前田 啓貴  松山大学, 経済学部, 講師 (00964222)
高木 修一  福島大学, 人間発達文化学類, 准教授 (20707773)
徐 キョウ哲  弘前大学, 教育推進機構, 助教 (20886684)
久保田 恵佑  福島県立医科大学, 公私立大学の部局等, 講師 (30888293)
研究期間 (年度) 2024-04-01 – 2028-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
17,810千円 (直接経費: 13,700千円、間接経費: 4,110千円)
2027年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2026年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2025年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2024年度: 6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
キーワードテスティング / 評価者 / 信頼性 / ベイズ統計 / 多相ラッシュモデル / 項目応答理論 / パフォーマンス評価 / 評価者トレーニング
研究開始時の研究の概要

英語のスピーキングテストをはじめとする「パフォーマンス評価」を行う際,評価者の評価の厳しさは必ずしも一貫したものではない。評価の一貫性や安定性を示すうえで「信頼性」という用語を用いることが多いが,実際にどのように評価の厳しさが変動しているのかを観察するためには複雑な統計モデルが必要となる。そこで本研究では,統計的知識を持たない方でも容易に評価の一貫性を計測することのできるツールを作成することを第一の目標としている。さらに,そのツールを用いて計測した一貫性の結果を評価者トレーニングの素材として利用することが可能であるかを検討する。

研究実績の概要

研究準備段階で作成していた統計モデルを更新し,3種類のSRM(Single Rater Model)を比較し,どのモデルを適用すべきかについて,国際学会(PROMS 2024)にて発表を行った。モデルそのものについては異議は無かったものの,Rasch modelの理念と今回提案したモデルの哲学が異なることを指摘されたため,今後は本研究で作成したモデルをSRM(Single Rater Model)と呼称し,誤解が生じないよう注意することとした。
上記のモデルうち,3つ目のモデルをベースに,各タイムポイントで評価の厳しさが0に戻る前提を含んだ新規モデルの構築も進行中である。これは,評価が異なる日時に行われる際,1人目の評価が大抵の場合評価の厳しさの基準(ルーブリックの影響は別にあると考えて)となるため,評価を実際に行う場合,この影響を考慮すべきであると考えたためである。本件については2025年度に開催される研究大会等で発表予定である。
また,本研究において使用することを想定しているPDT(Performance Decision Tree)の有効性を論じた論文が,Language Testing in Asia (Yokouchi, 2025) に掲載された。また,そのベースとなる発表2件を日本言語テスト学会にて発表した(横内, 2024; 久保田他, 2024)。そのうち,久保田他(2024)は今後発話プロトコルを取り,評価者の思考と統計分析による評価の厳しさのパターンが合致するかどうかを検証する研究第2段階の核となるルーブリックとなった。

現在までの達成度
現在までの達成度

2: おおむね順調に進展している

理由

本研究におけるベースとなるモデルが機能すること,R上でStanを使って分析を適切に実行し,再現できることを確認したため,研究の第一関門は突破したと考えている。そのうえで実際の評価時に発生しうる「評価の厳しさのリセット」について検討を開始できたのは,今後のモデル構築・更新に大きな影響を与えるものと思われる。
直接本研究に関連する業績として,研究論文1報,学会発表3件を報告できた。今後はこれらの研究をベースとしてモデルの改善を行いつつ,評価時の発話プロトコルの収集と分析を行う準備まで完了している。

今後の研究の推進方策

2025年度は,久保田他(2024)にて開発したルーブリックを用い,これまでに収集済みの英語スピーキングパフォーマンスデータを実験協力者に評価させ,評価のデータを収集するとともに,発話プロトコルのデータを収集する。
まず,評価データを用い,評価の厳しさの変動を検証する。評価者の厳しさ×時間経過の値は,次に挙げるモデルを用いて比較する。(1) MFRM(Linacre, 1989)を用いたバイアス分析,(2) Uto(2022)のモデル,(3) Yokouchi (2024) のモデル3,(4)Yokouchi (2025)の新規モデルの4つを用いる予定である。
続いて,評価時に収録した発話プロトコルを観察し,評価者が自覚した評価の厳しさの変動と,上記の量的分析に基づいた評価の厳しさの変動が合致するかを検証する。
これらの研究結果を受け,さらに分析のためのモデルを修正する必要があると判断した場合はモデルの再構成を行うが,問題がない場合,他のパフォーマンス評価(例.英語ライティング,小論文,採点競技など)におけるデータを収集し,同様に分析が可能であるかを検証したい。

報告書

(1件)
  • 2024 実施状況報告書
  • 研究成果

    (7件)
  • 研究データ

    (1件)

すべて 2025 2024

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (5件) (うち国際学会 1件)

  • [雑誌論文] Revisiting the effectiveness of a performance decision tree-style rubric compared to a grid-style rubric2025

    • 著者名/発表者名
      Yokouchi Yuichiro
    • 雑誌名

      Language Testing in Asia

      巻: 15 号: 1

    • DOI

      10.1186/s40468-024-00338-5

    • 関連する報告書
      2024 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 日本人EFL小中学生に対するCNRepの採点者信頼性の検討:多相ラッシュモデルを用いて2025

    • 著者名/発表者名
      佐久間康之,髙木修一,横内裕一郎
    • 雑誌名

      TELES Journal

      巻: 45

    • 関連する報告書
      2024 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] 口頭要約のためのPerformance Decision Treeの作成事例: 構成概念の齟齬とその解消2024

    • 著者名/発表者名
      久保田恵佑,前田啓貴,髙木修一,横内裕一郎
    • 学会等名
      日本言語テスト学会第27回全国研究大会
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] Performance Decision Treeの有用性の再考察2024

    • 著者名/発表者名
      横内裕一郎
    • 学会等名
      日本言語テスト学会第27回全国研究大会
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] 日本人EFL小中学生に対するCNRepの項目分析―多相ラッシュモデルを用いて―2024

    • 著者名/発表者名
      佐久間 康之, 髙木 修一, 横内裕一郎
    • 学会等名
      全国英語教育学会 第49回福岡研究大会
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] Model development to examine the rater severity drift for single rater: Proposal of a new model based on MFRM2024

    • 著者名/発表者名
      Yuichiro YOKOUCHI, Shuichi TAKAKI, Kuangzhe XU
    • 学会等名
      PROMS2024
    • 関連する報告書
      2024 実施状況報告書
    • 国際学会
  • [学会発表] 小学校教員免許状取得希望者への 学習評価に関する指導の効果 ―評価リテラシーの向上を目指した教育実践―2024

    • 著者名/発表者名
      髙木 修一, 横内裕一郎
    • 学会等名
      第24回小学校英語教育学会(JES) 中国・山口大会
    • 関連する報告書
      2024 実施状況報告書

すべて 2026

  • RSD_model32026

    • 資金配分機関
      • 資金配分機関名
        日本学術振興会
      • e-Rad資金配分機関ID
        1025
      • Crossref Funder Registry資金配分機関ID

        https://doi.org/10.13039/501100001691

      • 体系的番号
        JP24K00079
      • プロジェクト名
        スピーキング評価における評価の厳しさ変動を観測し信頼性を高める方法
    • データの名称
      RSD_model3
    • 掲載日
      2026-04-06
    • データの説明(抄録・要旨)
      PROMS 2024で発表したSRM(Single Rater Model)の分析コードと分析用ダミーデータ
    • データの分野
      人文・社会
    • データ種別
      測定・評価データ
    • 管理対象データの利活用・提供方針
      無償、制約なし、利用条件なし
    • アクセス種別
      公開
    • リポジトリ情報
      github
    • URI

      https://github.com/u16yokouchi/RSD_model3

    • データ管理者情報
      • データ管理者情報種別
        データ管理者
      • データ管理者情報
        経済経営学類
      • データ管理者情報種別
        データ管理機関
      • データ管理者情報
        福島大学
      • データ管理者情報種別
        データ管理者の連絡先
      • データ管理者情報
        yokouchi*econ.fukushima-u.ac.jp (メールアドレスは「@」を「*」に置換しています。)
    • データNo.

      JP24K00079-2024-0001

    • 関連する報告書
      2024 実施状況報告書

URL: 

公開日: 2024-04-11   更新日: 2026-04-14  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi