近年,深層学習を用いた小論文自動採点モデルが高精度を達成している.そのような自動採点モデルの訓練に利用される大量の得点付き小論文データセットは,一般に多数の評価者が分担して小論文を採点することで構築される.しかし,そのような場合,各小論文に与えられる得点が各評価者の甘さ/厳しさなどの特性に依存してしまう.そのように評価者バイアスの影響を受けたデータをモデルの訓練に利用すると自動採点の性能が低下する.この問題を解決するために,本研究では,研究代表者が長年研究してきた「評価者バイアスの影響を考慮して真スコアを推定できる数理モデル」を活用することで,評価者バイアスに頑健な自動採点手法を開発した.
|