ANOVA君/球面性検定の出力 の履歴(No.1)
球面性の仮定とは†
球面性の仮定は,被験者間計画の分散分析でいう分散の等質性の仮定に相当するものです。
これらは,複合対称性(compound symmetry)という仮定の一部をなしています。
複合対称性とは,条件間で分散が等しいこと,条件群の任意の対から作られる共分散が等しいことの両方が成り立つ状態をいいます(この仮定の前半部分は,分散の等質性の仮定そのものです)。
ただし,複合対称性はかなり厳しい基準で,実際のデータでは満たされないことが多いとされています。
また,この仮定は分散分析を適切に行うための十分条件ではありますが,必要条件ではありません。
これに対して,球面性の仮定(sphericity assumption;球形仮定,球状性仮定とも)は,もう少しゆるい基準になっており,すべての条件間の差の分散が等しいことを仮定するものです。
この球面性の仮定は,分散分析を適切に行うための必要十分条件であることが指摘されています。
なぜこの仮定が満たされないと分散分析が適切に行えないのか,何が“球”なのかは,直感的には理解しづらいところですが,次のように説明できるかもしれません(以下は,千野, 1993の説明をもとにアレンジしたものなので,数学的な正確さは保証しません)。
一般に,母集団から無作為に抽出した変数の分布をn次元上にプロットして楕円の形で表すとします。
このとき,分布の広がり具合は,楕円の主軸(x軸,y軸,z軸…)の長さによって表現できます。
わかりやすさのためにデータが3次元に分布するとして,x軸の分散がy軸,z軸よりも大きい場合を考えてみると,この楕円はx軸の方向に伸びたラグビーボールのような形になると思います。
これに対して,すべての主軸の長さが等しくなれば,この楕円は球の形に近づきます。
つまり,分布がどの方向に対しても等しければ,そのプロットは球に近づくと考えることができます。
一方,データの分布が次元によって異なれば,その分布を表す楕円はもっと歪んだ形になることでしょう。
このように考えると,データのばらつき方が条件間で等しければ“球”に近づくのだ,ということは何となくイメージできるのではないでしょうか。
もっと詳しく知りたい方は,千野先生のページや分散分析のノートが参考になるかと思います。
ANOVA君の球面性検定の仕様†
ANOVA君では,バージョン2.0.0から,反復測定要因(被験者内要因)について,Mauchlyの球面性検定とε(イプシロン)による自由度の調整を行うようになりました。
ここでは,その仕様について簡単に述べたいと思います。
このページでは,主にMauchlyの球面性検定を行った場合の出力を例に挙げています。anovakun 4.0.0以降では,デフォルトの球面性検定はMendozaの多標本球面性検定になりました(くわしくは,多標本球面性への対応を参照)。Mendozaの検定の場合も,W統計量がλ*に変わる点を除くとほぼ同様に出力を解釈することができます。
出力について†
球面性検定とそれに関連する指標について出力します。
以下は,3×3の2要因被験者内計画の場合の出力例です。
<< SPHERICITY INDICES >> == Mauchly's Sphericity Test and Epsilons == ------------------------------------------------------------------------------ Effect W approx.Chi df p LB GG HF ------------------------------------------------------------------------------ Global 0.0004 47.8600 35 0.0723 + 0.1250 0.5267 1.0481 A 0.7901 1.8845 2 0.3897 ns 0.5000 0.8265 0.9889 B 0.9496 0.4137 2 0.8131 ns 0.5000 0.9520 1.2007 AxB 0.0542 21.6225 9 0.0102 * 0.2500 0.5279 0.6938 ------------------------------------------------------------------------------ LB = lower.bound, GG = Greenhouse-Geisser, HF = Huynh-Feldt
左から,効果の名前,W統計量,近似カイ二乗値,自由度,p値,*マークが表示されます。
その後には,下限値,Greenhouse-Geisser,Huynh-Feldtの順に3つのεを出力します(値が小さく計算されるものの順です;これらの指標については,このページを参考にしてください)。
また,version 4.6.0からはChi-Mullerのイプシロンも併せて出力するようになりました。
W統計量,Greenhouse-Geisser,Huynh-Feldtは,いずれも球面性からの解離の程度を表しています。
1に近いほど球面性が成り立つ状態に近く,0に近いほどデータが球面性から外れていることを示します。
ANOVA君による球面性検定では,このうちのW統計量をカイ二乗分布に近似させて検定を行っています(より精度の高い近似法については,千野, 1994で紹介されています)。
Wの値が極端に低い(そのため近似カイ二乗値を計算できなかった)場合,カイ二乗値の欄にNaNが表示され,以下のような警告が出ることがあります。
[1] NaN 警告メッセージ: In log(x) : 計算結果が NaN になりました
このような場合,SPSSでは,単に「-」が表示されるようです。
このようなケースは,球面性から離れすぎていることを意味しているのか,別の対処法があるのか,どのように解釈してよいのかわからないので,とりあえず警告が出るままにしてあります(anovakun 2.0.0)。
上のような理由で警告が出た場合,球面性検定以外の結果には特に影響はありません。
水準数が2の場合†
反復測定要因の水準数が2である場合,常に球面性が成り立ちます。
水準間の差がひとつしかないので,水準間の差の分散が水準の組み合わせによって異なるという事態が発生しえないためです。
この場合,MauchlyのW,εの下限値,Greenhouse-Geisserのεはすべて1になります(Huynh-Feldtは1を超えることがあります)。
また,近似カイ二乗値と自由度は,計算上0と表示され,p値は表示されません。
このような場合には,自由度の調整を行う必要はありません(行っても,調整なしの場合と同じ結果になります)。
ただし,計画が独立測度を含む場合(混合要因計画の場合)に多標本球面性検定を適用すると,反復測定要因の水準数が2であっても,必ずしもカイ二乗値は0にならず,ときに有意になることがあります。
これは,1段階多標本球面性検定(Mendozaの検定とHarrisの検定)の扱う仮説のうち,群間での共分散構造の等質性の検定の部分が有意になる(群間で共分散構造が異なる)ことがあるためです。
複数の反復測定要因がある場合†
各反復測定要因の主効果と反復測定要因を含むすべての交互作用について,球面性検定を行いイプシロンを計算します。
また,一番上には「Global」として,大局的球面性検定の結果が表示されます(千野, 1993, 1994, 1998)。
ただし,大局的球面性検定の計算結果については,SPSSでは出力されないので,適切であるか確認が取れていません。
自由度の調整について†
球面性の仮定が成り立たないときには,ε(イプシロン)という統計量を使って自由度の調整を行うことで近似的に適切な分散分析を行うことができます。
ANOVA君では,オプションで選択すると,4つのεのいずれかの値を用いて分散分析における自由度を調整することができます。
この調整は,各反復測定要因の効果について,分散分析のときの自由度にεをかける(乗ずる)ことによって行います。
εは0~1の値を取り,0に近いほど球面性の仮定から離れていることを示しています。
そこで,εをかけることで,0に近いほどF検定に対して厳しい制限をかけることになります。
Huynh-Feldtのεは,計算上,1を超えることがあります。
このような場合,ANOVA君では,球面性に関する指標としては,計算結果として得られた値をそのまま表示します。
(SPSSでは,1を超えた場合は,1に直して表示するようです。)
1を超えた場合,球面性の仮定が破綻してはいなかった,ということで,Huynh-Feldtのεを1として調整を行うことになっています(Winer et al., 1991)。
そこで,ANOVA君でも,自由度の調整を行う場合には,1を超える値は1に直してから自由度にかけています。
なお,選択したオプションは,単純主効果の検定の際にも適用されます。
例えば,Greenhouse-Geisserのεによる調整を選択した場合,最初の分散分析でも,単純主効果の検定でも,GGに基づく調整を行います。
Huynh-Feldtのイプシロンの計算式†
Huynh & Feldt(1976)では,複数の反復測定要因があるときのHuynh-Feldtのεの一般的な計算式は以下のように記述されています。
ε~=(Nrε^-2)/r(N-g-rε^)
ここで,N=被験者数,r=(たぶん)自由度(すべての被験者内要因の水準数の積-1),ε^=Greenhouse-Geisserのε,g=グループ数(すべての被験者間要因の水準数の積)です。
しかし,Lecoutre(1991)は,この式はgが2以上のとき(1つ以上の被験者間要因を含むとき=混合要因計画のとき)には誤りであるとして,正しい一般式は以下の通りであると指摘しています。
ε~=((N-g+1)rε^-2)/r(N-g-rε^)
そして,テキストや統計パッケージでも,上の誤った式が用いられていることが多いので注意するようにと呼びかけています(論文刊行当時)。
Lecoutre(1991)の論文はかなりコンパクトなもので,上の方の式が誤りである理由などは説明されておらず,その詳細はよくわかりません。
しかし,このLecoutreの修正を紹介している文献では,“実はHuynh & Feldt(1976)の方が正しい”といった再反論はなされていませんし(e.g., Howell, 2010),最近のテキストでもこちらの式を提示しており(Kirk, 2013, p. 576),やはりこの修正版が正しいようです。
そこで,ANOVA君でも,version 4.2.0以降では,Huynh-Feldtのεの計算式をLecoutreの修正に基づく式に改めました(これ以前のバージョンは,Huynh & Feldt, 1976の計算式に基づいています;Lecoutreの論文を入手できていなかったので)。
ちなみに,SPSS(25.0)の反復測定オプションでは,出力から見てHuynh & Feldt(1976)の式を用いているようです。
Howell(2010)によると,“SPSSもSASもHuynh-Feldtのεの誤った値を計算し続けている”とのことです(p. 477)。
このため,ANOVA君(version 4.2.0以降)とSPSSで出力されるHuynh-Feldtのεは,混合要因計画のときには一致しないことになります。
もしかしたら,SPSSのより新しいバージョンではこの点は修正されるかもしれません。
(SAS/STAT 9.22(2010)以降では“Huynh-Feldt-Lecoutre Epsilon”としてLecoutreによる修正版のほうをデフォルトで出力するようになったようです。)
Chi-Mullerのイプシロンについて†
SAS/STAT(R) 9.22(2010年)では,Greenhouse-GeisserとHuynh-Feldtのεに加えて,オプション指定によってChi-Mullerのεを出力できるようになりました。
Greenhouse-Geisserのεは球面性からの逸脱が小さい場合には修正値として厳しすぎるのに対して,Huynh-Feldtのεは球面性からの逸脱が大きい場合には修正がゆるすぎることが知られています。
使い分けの目安としては,Greenhouse-Geisserのεが0.75以上のときにはGreenhouse-Geisser,それ未満のときにはHuynh-Feldtがよいとされています。
しかし,これは絶対的な基準ではありません。
また,同じ実験の中でGreenhouse-GeisserとHuynh-Feldtを使い分けることはしないのがふつうなので,複数の反復測定要因がありGreenhouse-Geisserのεの値が異なるときには,どちらを使えばよいのかあいまいさが生じます。
これに対して,Chi-Mullerのεは,球面性からの逸脱度にかかわらず一般的に使える調整値として利用できます。
逸脱度が大きいときにはより低い値に,小さいときにはより高い値になります。
シミュレーションの結果によれば,Chi-Mullerのεは他のεに比べてより広い状況で優れた近似パフォーマンスを示したとのことです。
なお,Chi-Mullerのεは,Huynh-Feldtのεと同様に計算上は1を超えることがあります。
この場合,ANOVA君では,Huynh-Feldtと同じく,球面性の指標としてはそのままの値を,自由度の調整値としては1に直した値を用いるようにしています。
さらに,Chi-Mullerのεは,下限値よりも小さい値になることもあります。
この場合は,ANVOA君は球面性の指標としてもChi-Mullerのεを下限値に直して表示するようにしています。
Chi-Mullerのεは計算上のつごうから水準数2の被験者内要因でも下限値を下まわることがあるのですが,球面性からの逸脱度を表しているように見えてまぎらわしいためです。
このように,現状ではやや一貫性を欠く仕様となっているので,この点はいずれ改めることもあるかもしれません。
参考文献†
千野直仁 (1993). 反復測度デザイン概説-その1-. 愛知学院大学文学部紀要, 23, 223-236. [Link to Cinii]
千野直仁 (1994). 反復測度デザイン概説-その2-球形検定とその周辺についての批判的レビュー-. 愛知学院大学文学部紀要, 24, 103-119. [Link to Cinii]
千野直仁 (1998). 反復測定(度)分散分析/基礎と応用. http://www.aichi-gakuin.ac.jp/~chino/anova/contents.html
Howell, D. C. (2010). Statistical methods for psychology (7th edition). Wadsworth, Cengage Learning.
Huynh, H., & Feldt, L. S. (1976). Estimation of the Box correction for degrees of freedom from sample data in the randomized block and split-plot designs. Journal of Educational Statistics, 1, 69-82.
Huynh, H. (1978). Some approximate tests for repeated measurement designs. Psychometrika, 43, 161-175.
Kirk, R. E. (1995). Experimental design: Procedures for the behavioral sciences (3rd edition). Brooks/Code Publishing Company.(特に,7.4節, pp. 271-282.)
Kirk, R. E. (2013). Experimental design: Procedures for the behavioral sciences (4th edition). Los Angeles: SAGE Publications.
Lecoutre, B. (1991). A correction for the e approximate test in repeated measures designs with two or more independent groups. Journal of Educational Statistics, 16, 371-372.
Winer, B. J., Brown, D. R., & Michels, K. M. (1991). Statistical principles in experimental design (3rd edition). Boston, Massachusetts: McGraw Hill.(特に,4.4節, pp. 239-261.)