JLTA Web Tutorial
測定の標準誤差:1点の差には意味があるか
image
測定の標準誤差 (SEM) の例として、TOEIC® (Test of English for International Communication) テストの場合を紹介します。TOEICテストのスコアは、リスニング・リーディングともに5〜495点の間で示され、トータルスコアは2技能の合計点で10〜990点で示されます。TOEICリスニング・リーディングのスコアのSEMは共に約25点と報告されています (ETS, 2007b, 2008; 注:25という値を得るための計算式の報告はなし)。そのため、68%の確率で25点のスコアのばらつきがあることが分かります。68%の確率で、リスニングスコアは誤差で25点は上下する可能性があるということです。リスニングスコアが200点の場合には、誤差で175〜225点の変動がありえることになります。

95%の確率でのスコアのばらつきは、式2を使うと1.96×25ですから、49点だとわかります。つまり、95%の確率で、リスニングスコアは誤差で49点は上下する可能性があるということです。リスニングスコアが200点の場合には、151〜249点の間にその人の真のスコアがあると、かなり自信を持って考えてよいことになります。

なお、ここで扱っている値は近似の推定値で、厳密ではないところがありますので、「95%の確率でのスコアのばらつき」よりは、「かなりの確率でのスコアのばらつき」と解釈する方が良いようです (Harvill, 1991)。