JLTA Web Tutorial
測定の標準誤差:1点の差には意味があるか
image
次に、200点のAさんのスコアと150点のCさんとのスコアを比べてみましょう。(1) (2) Aさんのスコア範囲は、スライド31と同じく、131〜269点です。(3) その範囲の中に150点は入りますので、「AさんはCさんよりリスニングスコアが高い」とは自信を持っては言えません。つまり、テストの誤差のためにスコアが違うように見えているだけで、「2人のスコアは同じ可能性がある」ということです。

このように2つの得点を比較するには、測定の標準誤差 (SEM) の2つの範囲の重なりを見る方法と、1つの得点から差の標準誤差 (SEdiff) の範囲を出し、もう一つの得点がその範囲に入るかを見る方法の2つがあります。TOEICの例を考えると、1つ目の方法では、98 (= 49×2) 点より大きい得点差があるときには異なる点数だとかなり自信を持って言えますが、2つ目の方法では、69点より大きい得点差があるときにはそれが言えます。つまり、2つ目の方法の方が甘い基準ということです。

2つのどちらが良いかについては、Harvill (1991) には明確に書いてありませんが、1つ目の方法がより丁寧に説明されています。ETS (2007b, 2008) では2つ目の方法での解釈が書いてあります。