ANOVA君/複数の要因がある計画における多重比較 - 井関龍太のページ

ホーム   編集 凍結 差分 バックアップ 添付 コピー 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS

ANOVA君/複数の要因がある計画における多重比較

Last-modified: 2013年09月28日 (土) 22:28:33 (1875d)
Top > ANOVA君 > 複数の要因がある計画における多重比較

問題

anovakun 1.0.0では,2つ以上の要因を含む計画の分析では,多重比較の結果が適切でないことがわかりました。

ちなみに,ここでの「適切」ということばは「SPSSと出力が一致する」ことを意味します。
SPSSがすべて正しいと考えているわけではないのですが,特に他のやり方を支持する根拠がないのであれば,おそらくは多くの専門家が監修しているSPSSによっておくのが無難であろうと考えています。

本題に戻ると,多重比較の結果が適切でなかった理由は判明しました。

多重比較をする際に,ANOVA君では,修正Bonferroniの方法を行うためにt検定もしくは(多重比較用の)多重t検定を用いています。
このとき,anovakun 1.0.0では,要因の存在を特に気にせず(つまり,ないものと見なして)そのままt統計量を計算していました。

例えば,2(A要因:a1,a2)×3(B要因:b1,b2,b3)の計画において,B要因の主効果が有意であったとします。
B要因について多重比較をするとき,例えば,b1水準の中にはa1とa2のデータの両方が含まれているわけですが,これを単に同じ水準の中の別のデータと見なして計算していたわけです。

そのようにすると,当然,a1とa2の条件間の違い,A要因とB要因の交互作用の効果を無視していることになります。
実際には,それらの効果が存在することを想定して要因計画を設定しているわけですから,この方法だと分散分析と多重比較で一貫しない姿勢を取っているということになるでしょう。

対処法

この問題への対処法もある程度明らかになりました。

t統計量を(要因を無視して独立に計算するのではなく)上位の分析のMSeに基づいて計算すればいいようです。
HSD法などでは,多重比較を行ないたい効果のMSeを使ってq統計量を計算します。
これと同じように,t統計量もMSeから計算するというわけです。
このようにすれば,多重比較の対象でない要因や他の要因との交互作用による変動を分離した上での誤差分散を得ることができます。

今まで,LSD法やHSD法を使っていながら,これがt統計量と同じか,それに手を加えた統計量であるということに気づかないでいました (^^;
おぼえがきとして,以下にMSeからt統計量を算出するための式を書いておきます。

  • t=|平均1-平均2|/sqrt(MSe×(1/n1 + 1/n2))

※比較する2つの水準の平均をそれぞれ,平均1,平均2,データ数をn1,n2と表しています

データ数が等しい場合は,以下の式でも同じ結果を得られます。

  • t=|平均1-平均2|/sqrt(MSe×2/n))

※nは分析に用いた全データ数=n1+n2です

これらのt統計量は,おそらく,LSD法と同じ統計量になると思います。
なお,このt統計量をもとに有意性検定を行なう際には,MSeを算出する際に用いた自由度の値を使います。

ちなみに,SPSSでは,「主効果の比較」の出力パターンから見て,被験者間要因の場合には,上位の分析のMSeをそのまま使用し,被験者内要因の場合には,分析対象となる2水準のみの分散分析で得られるMSeを使っているようです。

例えば,上の例でいうと,b1とb2の水準間の(主効果についての)多重比較をしたいときには,2(A要因:a1,a2)×2(B要因:b1,b2)の分散分析の結果として得られるB要因のMSeを用いるということです。
b2とb3の比較なら,同様にb2とb3だけを用いた分散分析のMSeを利用します。

これは,反復測度の場合には,球面性の仮定に違反している可能性を考慮して,水準別の誤差項を用いた方がよいとの指摘にしたがっているものと思われます(Keselman & Keselman, 1993)。

ただ,このやり方にしたがうと,被験者内要因についての多重比較では,計算量が圧倒的に増えてしまうので(しかも,比較数が増えるほど倍増します),ANOVA君の動作がますます遅くなることが予想されます……。

ただし,被験者間要因を含まない完全な被験者内計画では,分析対象となる要因以外のすべての条件を通してデータを平均してから,各比較の対にt検定を繰り返すという手続きを取っても,上の手順を取った場合と同じ結果が得られます。
(anovakun 2.0.0では,混合要因計画のデータにも対応できるようにするため,分散分析による方法を採用しています。)

非釣り合い型計画(unbalanced design)の場合には,さらなる考慮を行なう必要があります。

まず,t統計量の分子として,通常の平均の差を取るのではなく,周辺平均(marginal mean)の差を用いる必要があります。

ここでいう周辺平均とは,すべての条件を組み合わせたセルごとの平均をいったん計算してから,分析に関連しない水準を通して平均同士を平均したものをいいます。釣り合い型計画の場合は,通常の平均と一致します。

次に,t統計量の分母の(1/n1 + 1/n2)の部分を以下のように変更する必要があります。

  • ((1/n11, 1/n12, ..., 1/n1k)の平均 + (1/n21, 1/n22, ..., 1/n2k)の平均)/ 群の数

※nikは,ⅰ=分析対象となる要因の水準,k=分析対象となる要因内にできる群を表しています
※群の数は,分析対象となる要因を除いた,すべての要因のすべての水準数をかけたもの

わかりにくいので具体例を示します。
各セルのデータ数が以下の通りであったとします。

b1b2b3
a1343
a2443

B要因の多重比較として,b1とb2の比較をしようとしている場合を考えてみます。
このときのt統計量は,以下のように計算されます。

  • |b1の平均-b2の平均|/sqrt(MSe×((1/3 + 1/4)/2 + (1/4 + 1/4) / 2))

最後に,それぞれのケースで使用するMSeについて,表にまとめてみました。

被験者間要因被験者内要因
被験者間計画もとの分析のMSe×
被験者内計画×ターゲット効果を2水準としたANOVAにおける誤差項のMS
混合要因計画ターゲットとなる効果の誤差項のMSターゲット効果を2水準としたANOVAにおける誤差項のMS

状況

anovakun 2.0.0では,上記の通りに計算手続きを変更しました(2007-10-01)。


Keselman, H. J., & Keselman, J. C. (1993). Analysis of repeated measurements. In L. K. Edwards (Ed.), Applied analysis of variance in behaviroal science (pp. 105-145). New York, Marcel Dekker, Inc.

TrackBack(0) | 外部リンク元 | このエントリーをはてなブックマークに追加