分散分析と多重比較法(Tukey-Kramer・Bonferroni)後編
さて、昨日の記事の続きを書いていきます。
後編では、多重比較法を扱っていきます。
分散分析を扱った前編はこちら。
turtlewalk.hatenablog.jp
多重比較法
分散分析では、どれか1つ以上の群間に差があることしか分からず、どの群間にあるのかは分かりませんでした。
それを調べるには、多重比較が必要となります。
単純に群同士を検定していくと、有意水準が乗算されていき、第1種の過誤を犯しやすくなってしまいます。
比較する群の組み合わせ数 | 1 | 2 | 3 | 4 |
第1種の過誤を犯さない確率 | 0.95 | 0.90 | 0.86 | 0.81 |
(有意水準α=0.05のとき)
説明に昨日と同じ標本集団を使っていきます。
群1 | 群2 | 群3 | 群4 | |
標本1 | 10 | 15 | 24 | 28 |
標本2 | 11 | 12 | 26 | 30 |
標本3 | 8 | 13 | 23 | 31 |
有意水準は0.05とします。
t検定
まず試しに、それぞれをt検定で単純に検定していきます。
TTEST関数を使えば、簡単にp値を算出できます。
TTEST(配列1,配列2,尾部,検定の種類)
配列1と配列2にそれぞれ群の標本を入れます。
尾部(1:片側検定, 2:両側検定)
検定の種類(1:対応のある標本, 2:分散の等しい標本, 3:分散の等しくない標本)
にしたがって、該当する数値を入れます。(今回は尾部が2、検定の種類も2)
p値 | 群2 | 群3 | 群4 |
群1 | 0.042 | <0.001 | <0.001 |
群2 | <0.001 | <0.001 | |
群3 | 0.013 |
全ての群間で有意だと検定されました。
t検定で分析ツールを使う場合は、
http://www1.tcue.ac.jp/home1/abek/htdocs/stat/Excel/t-test/t-test.html
が参考になります。
t検定での結果は、先に書いたように「甘い」検定となっていて、適当だとは言えません。
そこで多重比較法を使って、第1種の過誤の起こす確率を減らしていきます。
方法は多数ありますが、分析ツールを使わずに計算できそうだったのが、Tukey-Kramer・Bonferroniの2種類だったので、その2つを書いていきます。
2つの方法
どちらの方法にもメリット・デメリットがあります。
Tukey-Kramer
まずはTukey-Kramer法からやってみます。
ステューデント化された範囲のq値というものを計算し、それをq境界値と比べて検定します。
(関数での、p値の算出方法は見つけられませんでした)
が比較する群の平均、が群内変動(誤差)の分散(前編より、2.33)、が標本サイズ(すべて3)となります。
それぞれの群間でq値を計算すると、
q値 | 群2 | 群3 | 群4 |
群1 | 2.94 | 11.8 | 16.0 |
群2 | 8.82 | 13.1 | |
群3 | 4.28 |
q境界値は分布表から求めます。
Deus ex machinaな日々: スチューデント化された範囲の表の補間
vは群内変動の自由度(自由度=(標本サイズ-1) × 群数)なので、8になります。
よって4.53、これをで割ると、Tukey-Kramer法でのq境界値になります。
q境界値 | 3.20 |
q境界値よりもq値が大きければ、有意だと検定されます。
Tukey-Kramerでは、単純なt検定と異なり、群1-群2間では帰無仮説が有意ではありませんでした。
Bonferroni
次に、Bonferroni法です。
Bonferroni法は、t検定での結果を利用して、そのときの有意水準を検定する組み合わせの数で割った数にするだけです。
また代わりに、p値を検定する組み合わせの数で掛けることもできます。
今回は、後者の方法でやっていきます。
p値 | 群2 | 群3 | 群4 |
群1 | 0.254 | 0.002 | <0.001 |
群2 | 0.005 | 0.001 | |
群3 | 0.077 |
よって、群1-群2間・群3-群4間では有意と判定されませんでした。
Bonferroni法は、第2種の過誤が大きくなりやすい方法であり、その点を解消するための方法も開発されています。
http://www.med.osaka-u.ac.jp/pub/kid/clinicaljournalclub1.html
このように多重比較法では、検定が厳しくなっています。
この他にも、多重比較法はたくさんあり、用途によってどれを用いるか検討していく必要があります。