亀の歩み

備忘録として

多重比較法(Williams)

Tukey-Kramer・Bonferroniについて書きましたが、他の方法が解説されているページを見つけたので、その中でも自分が使いそうなWilliamsを書いておきます。

http://www012.upp.so-net.ne.jp/doi/biostat/biostat.html
下の方の(多重比較)のところです。


Williamsは、群間に順位のあるときに採用される検定です。
全ての群をまとめた仮説を立て、それから徐々に群を狭めていく方法をとります。

群が4つある場合
 H_{1234},\ H_{123},\ H_{12}
と仮説を立て、左から検定していきます。

仮説が棄却されたときは、さらに右の仮説を検定します。
仮説が棄却されなかったときは、その仮説より右の仮説は保留されます。

群のプール

 \mu_1\leq\mu_2\leq\mu_3\leq\mu_4
を示したいときに、

 \bar{x}_1\leq\bar{x}_2\leq\bar{x}_3>\bar{x}_4
のように標本平均の不等号が逆になっている箇所がある場合は、群をプールする必要があります。

やり方は簡単で、群1と群2の平均を出すだけです。
 \bar{x}_1\leq\bar{x}_2\leq\bar{x}_{34}

それでも不等号が逆になっている場合、
 \bar{x}_1\leq\bar{x}_2>\bar{x}_{34}

不等号の順番が全て同じになるまで、群をプールしていきます。
 \bar{x}_1\leq\bar{x}_{234}

統計量y

標本が4群あって、群のプールが必要ないときを例にして計算方法を説明していきます。

各群のデータの合計を T_iとして、統計量yを計算します。
 \displaystyle y_{24}=\frac{T_2+T_3+T_4}{n_2+n_3+n_4}\\ \displaystyle y_{34}=\frac{T_3+T_4}{n_3+n_4}\\ \displaystyle y_{44}=\frac{T_4}{n_4}

 \mu_1\leq\mu_2\leq\mu_3\leq\mu_4を示したいときは、計算したyの中での最大値Mを、
 \mu_1\geq\mu_2\geq\mu_3\geq\mu_4を示したいときは、計算したyの中での最小値mを導きます。

検定

検定は、t検定で行います。

 \mu_1\leq\mu_2\leq\mu_3\leq\mu_4を示したいときは、
 \displaystyle \mathrm{t}値 = \frac{M-\overline{x}_{1}}{\sqrt{{\hat\sigma}^2(\frac{1}{n_1}+\frac{1}{n_4})}}

 \mu_1\geq\mu_2\geq\mu_3\geq\mu_4を示したいときは、
 \displaystyle \mathrm{t}値 = \frac{\overline{x}_1-m}{\sqrt{{\hat\sigma}^2(\frac{1}{n_1}+\frac{1}{n_4})}}


 \hat{\sigma}^2は、誤差分散(郡内分散)です。
群数をaとすると、

自由度 = (標本サイズ-1) × a

 \displaystyle \hat{\sigma}^2 = \left\{{\sum_{i=1}^{a} (n_i-1)V_i}\right\}\div{自由度}

小さい側の群は、常にプールしていない平均を使用します( \overline{x}_{12}とプールしていても、 \overline{x}_{1}とする)。

t値を求めたら、TDIST関数でp値を求め、棄却されるか確かめます。
棄却されたならば、右の検定を保留されるまでやっていきます。

 H_{1234},\ H_{123}が棄却され、 H_{12}が棄却されなければ、
 \bar{x}_1\leq\bar{x}_3,\ \bar{x}_4
と言うことができます。


2016/1/20:方法の説明が全く合ってなかったので、下記の本を参考にして、手直ししました。

統計的多重比較法の基礎

統計的多重比較法の基礎