統計的仮説検定

(2020-05-10)

統計的仮説検定(statistical hypothesis test)は母集団に対するある仮説が妥当だと言えるか標本から判断する手法。 棄却(reject)されることが期待される帰無仮説(null hypothesis)H_0と、それに相対する本命の対立仮説(alternative hypothesis)H_1を立て、 検定統計量を出し、帰無仮説が正しい場合での確率分布でそれより外れた値が観測される確率であるp値が、設定した有意水準α(0.05にすることが多い)を下回れば帰無仮説が棄却され対立仮説が受容(accept)される。 有意水準はあくまで帰無仮説を棄却できるかのラインなので、それを上回ったからといって帰無仮説が受容できる程度に妥当である保証はないが、事実上受容することも少なくない。

母集団が特定の分布に従うと仮定しそのパラメータである平均や分散などを用いるパラメトリックな手法と、そうでないノンパラメトリックな手法がある。 パラメトリックな手法の方が、帰無仮説が誤っている場合にそれを棄却する確率である検出力が高いが、標本数が小さい場合は分布を仮定することが難しいためノンパラメトリックな手法の方が適している。

t-検定

正規分布を仮定するパラメトリックな手法。ちなみに正規分布かどうかの検定としてShapiro–Wilkの検定などがある。

平均μの正規表現に従うn個の標本から計算される次の確率変数Tが、自由度n-1のt-分布に従うことを利用する。

確率変数T

確率分布(二項分布/ポアソン分布/正規分布/カイ二乗分布/t分布) - sambaiz-net

標本 (1.1, 1.5, 1.2, 1.3, 1.4) に対して帰無仮説"平均1.0の正規分布に従う"で検定してみる。

n = 5
bar{X} = (1.1 + 1.5 + 1.2 + 1.3 + 1.4) / 5 = 1.3
s^2 = ((1.1 - 1.3)^2 + (1.5 - 1.3)^2 + (1.2 - 1.3)^2 + (1.3 - 1.3)^2 + (1.4 - 1.3)^2) / (5 - 1) = 0.025
T = ((1.3 - 1.0)/sqrt(0.025)) * sqrt(5) = 4.242

もし帰無仮説が正しいならこのTが自由度4のt-分布に従うことになる。 t分布表を見ると自由度4、有意水準0.05のとき棄却される臨界値は2.7764になっている。 したがって帰無仮説は棄却され、この標本は平均1.0の正規分布に従っていないであろうことが確認された。

では平均どれくらいだと言えるのか、Tが棄却されない範囲でのμを調べることで区間推定できる。

-2.7764 < T = ((1.3 - μ)/sqrt(0.025)) * sqrt(5) < 2.7764
1.3 - 2.7764 * sqrt(0.025) / sqrt(5) < μ < 1.3 + 2.7764 * sqrt(0.025) / sqrt(5)
1.103 < μ < 1.496

標本数を増やせればt分布の裾野が狭まりもう少し区間を絞ることができる。

参考

統計学入門

統計的仮説検定において学習者の理解を難しくする幾つかの要因の検討

Nonparametric statistics - Wikipedia

パラメトリックとノンパラメトリック