亀の歩み

備忘録として

分散分析と多重比較法(Tukey-Kramer・Bonferroni)後編

さて、昨日の記事の続きを書いていきます。
後編では、多重比較法を扱っていきます。
分散分析を扱った前編はこちら。
turtlewalk.hatenablog.jp

多重比較法

分散分析では、どれか1つ以上の群間に差があることしか分からず、どの群間にあるのかは分かりませんでした。
それを調べるには、多重比較が必要となります。

単純に群同士を検定していくと、有意水準が乗算されていき、第1種の過誤を犯しやすくなってしまいます。

比較する群の組み合わせ数 1 2 3 4
第1種の過誤を犯さない確率 0.95 0.90 0.86 0.81

有意水準α=0.05のとき)


説明に昨日と同じ標本集団を使っていきます。

群1 群2 群3 群4
標本1 10 15 24 28
標本2 11 12 26 30
標本3 8 13 23 31

有意水準は0.05とします。

t検定

まず試しに、それぞれをt検定で単純に検定していきます。
TTEST関数を使えば、簡単にp値を算出できます。

TTEST(配列1,配列2,尾部,検定の種類)

配列1と配列2にそれぞれ群の標本を入れます。
尾部(1:片側検定, 2:両側検定)
検定の種類(1:対応のある標本, 2:分散の等しい標本, 3:分散の等しくない標本)
にしたがって、該当する数値を入れます。(今回は尾部が2、検定の種類も2)

p値 群2 群3 群4
群1 0.042 <0.001 <0.001
群2 <0.001 <0.001
群3 0.013

全ての群間で有意だと検定されました。

t検定で分析ツールを使う場合は、
http://www1.tcue.ac.jp/home1/abek/htdocs/stat/Excel/t-test/t-test.html
が参考になります。


t検定での結果は、先に書いたように「甘い」検定となっていて、適当だとは言えません。
そこで多重比較法を使って、第1種の過誤の起こす確率を減らしていきます。
方法は多数ありますが、分析ツールを使わずに計算できそうだったのが、Tukey-KramerBonferroniの2種類だったので、その2つを書いていきます。

2つの方法

どちらの方法にもメリット・デメリットがあります。

Tukey-Kramer

メリット

  • 比較する標本サイズが異なっていてもよい
  • 使えるソフトウェアが多い?

デメリット

  • データが正規分布に従っていなければならない
  • 群間が等分散である必要がある
Bonferroni

メリット

  • 操作が簡便

デメリット

  • 比較する標本サイズが同じでなければならない
  • 5群以上では検出力が落ちる


Tukey-Kramer

まずはTukey-Kramer法からやってみます。

ステューデント化された範囲のq値というものを計算し、それをq境界値と比べて検定します。
(関数での、p値の算出方法は見つけられませんでした)

 \displaystyle \mathrm{q}値=\frac{\overline{x}_1-\overline{x}_2}{\sqrt{{\hat{\sigma}_e}^2(\frac{1}{n_1}+\frac{1}{n_2})}}

 \overline{x}比較する群の平均 \hat{\sigma_e}群内変動(誤差)の分散(前編より、2.33)、 n標本サイズ(すべて3)となります。


それぞれの群間でq値を計算すると、

q値 群2 群3 群4
群1 2.94 11.8 16.0
群2 8.82 13.1
群3 4.28


q境界値は分布表から求めます。
Deus ex machinaな日々: スチューデント化された範囲の表の補間

vは群内変動の自由度(自由度=(標本サイズ-1) × 群数)なので、8になります。
よって4.53、これを \sqrt{2}で割ると、Tukey-Kramer法でのq境界値になります。

q境界値 3.20

q境界値よりもq値が大きければ、有意だと検定されます。
Tukey-Kramerでは、単純なt検定と異なり、群1-群2間では帰無仮説が有意ではありませんでした。

Bonferroni

次に、Bonferroni法です。

Bonferroni法は、t検定での結果を利用して、そのときの有意水準を検定する組み合わせの数で割った数にするだけです。
また代わりに、p値を検定する組み合わせの数で掛けることもできます。
今回は、後者の方法でやっていきます。

p値 群2 群3 群4
群1 0.254 0.002 <0.001
群2 0.005 0.001
群3 0.077

よって、群1-群2間・群3-群4間では有意と判定されませんでした。


Bonferroni法は、第2種の過誤が大きくなりやすい方法であり、その点を解消するための方法も開発されています。
http://www.med.osaka-u.ac.jp/pub/kid/clinicaljournalclub1.html


このように多重比較法では、検定が厳しくなっています。

この他にも、多重比較法はたくさんあり、用途によってどれを用いるか検討していく必要があります。