研究概要 |
同一のtest specificationに基づいて作成されているが、内部係留項目を使って等化されていない複数のテストフオームは厳密な意味では同等テストではない。この場合、外部係留項目を設定して等化する必要があり、二つの英語能力試験(Form A,Form B)をもとに、係留テストを作成し、同じ学習環境にあると考えられる英語学習者173名に実施した。Form A,Form Bの両方にsequence itemsが含まれており、係留テストにもFormAからの項日を含めた。 Form A,Form Bを受けた母集団からそれぞれ1,000名を無作為に抽出したテストデータならびに係留テストのデータ分析を行い、下記の知見を得た。 (1)英文(passages)ではなく、sequence itemsに使われている回答形式(マッチング形式)自体が強い局所依存性を誘発する。(2)Rasch Measurement Modelを用い、係留テストのsequence itemsを分析した結果、多値的項目としてのthresholdsが順番に並んでおらず、この形式の各項目での得点はテスト問題作成者が意図したように機能していない。(3)Form A、Form B、係留テストに含まれるsequence itemsは各ステムの項目を一つのセットとしてとらえ、binary dataとして処理する方法が、それらを二値的項目あるいは多値的項日として扱うよりも学習者の能力を正確に測定した。(4)sequence itemsは、各要素の絶対的な位置を基準として採点するより、各要素間のつながりを考慮にいれた採点方法では局所依存性が少なくなる傾向をみせた。
|