をテンプレートにして作成 - 井関龍太のページ
井関龍太のページ
をテンプレートにして作成
開始行:
心理学や行動科学の統計解析で最もよく用いられる分析法のひ...
この分散分析を考案したのが統計学者の[[ロナルド・フィッシ...
今回,『R. A. フィッシャーの統計理論-推測統計学の形成と...
この本は,フィッシャーの統計理論を単純に紹介するのではな...
フィッシャーの分散分析がもともと農事試験の評価を行うため...
フィッシャーは各種の肥料や品種を使うことが作物の収穫量に...
しかし,この評価は化学などにおける試験とは違って容易では...
というのは,以下のような事情があったからです。
>…(中略)…統計的方法の適用対象としての農事試験は,基本的...
<
こうした,雑多な要因の影響の中で統制条件との比較から結論...
また,農事試験では(品種にもよると思いますが)一年に一回...
このデータ収集の問題も,行動科学におけるデータ収集の問題...
さて,フィッシャーの実験計画法及び分散分析がそれまでの農...
フィッシャー以前の農事試験では,試験(実験)における誤差...
実験にとって誤差は大敵です。
農事試験でも,同じ作物を同じように育てたとしても,その年...
そこで,極力,環境を同じにして誤差を最小限にしようとする...
しかし,フィッシャーの考え方は少し違っていました。
誤差を減らそうとするのではなく,誤差の程度を正確に推定し...
そして,この正確な推定という目的のためには,誤差を減らそ...
測定には誤差は常につきまとうもので,結局,これをなくすこ...
だったら,減らすのではなく,どの程度の誤差が生じたのかを...
そのような管理された実験条件を作るための方法論が実験計画...
これを実現するための3つの工程が,局所管理(local control...
例えば,圃場全体の肥沃度を均一にすることが難しい場合は,...
そして,このブロック内では肥沃度が均一になるようにします...
こうすれば,比較するブロック内の誤差は均質ですから,各ブ...
このように,実験計画法は一種の誤差管理術であったことがわ...
より妥当な誤差の推定値が得られたなら,条件(処遇)による...
ところで,統計的検定そのものは,フィッシャー以前にも既に...
しかし,フィッシャーとそれ以前とでは,検定に対する考え方...
フィッシャー以前では,誤差は観測の失敗と捉えられ,標本を...
そのため,検定というものを観測精度のよさの指標として用い...
例えば,フィッシャー以前にも,K. ピアソンのχ&SUP(){2};適...
ただし,ピアソンはこれを帰無仮説の棄却を目的として行って...
そうではなく,標本分布と理論分布の乖離が小さい,これらの...
χ&SUP(){2};値が高い場合には「偏っている」,小さい場合には...
芝村はこれを以下のように評しています。
>有意水準という一定の判定基準を有しないことが,適合度の査...
<
フィッシャーは標本分布と理論分布の乖離の程度から条件(処...
乖離がどのくらい小さいか,つまり,データがどのくらいフィ...
また,そのためか,判定基準というものもなく,帰無仮説の設...
ちなみに,差がある方ではなく,ない方に注目するという点で...
χ&SUP(){2};検定の名で現在一般にイメージされるような分割表...
それでは,フィッシャーの方は,どうして帰無仮説を立ててこ...
著者は,フィッシャーの有意性検定の意義を,農事試験の専門...
フィッシャー以前は,農事試験の成果は,専門家の経験に基づ...
ここでいう専門家とは,農業に携わって生計を立てる人ではな...
この専門家の人々は,農事試験の結果に基づいて,新たな肥料...
一般の農業従事者からすれば,自分たちの実感から離れた環境...
自分たちにわからない基準で“専門家”が判定した結果を信じな...
そこで,誰にでも納得のいく,客観的な判定の基準がほしいと...
この基準こそが“有意水準”であり,例の5%とか1%の数値に...
フィッシャーは,実験計画法を考案しただけでなく,この判定...
有意水準や帰無仮説といった概念,そして,有意性検定は,そ...
しかし,有意性検定は,本当に著者の言うように「実験結果の...
本書でも紹介されていますが,有意性検定の普及の背後には,...
現代の日本の大学でも,心理学等の専攻では統計の授業が必修...
そこから推しても,当時の“伝道者”の人たちの努力は並々なら...
この努力は,サイエンス・コミュニケーションの観点から評価...
当時は,このように,ある意味理想的な形で有意性検定という...
しかし,有意性検定を利用している現代の科学者の多くは“非専...
5%の基準に頼っていれば,効果に意味があるのかどうかいち...
あるいは,“専門家と非専門家の”ではなく,“専門家の間での有...
つまり,“5%”で有意だったんだから文句ないだろう,という...
フィッシャーは,この点をどのように考えていたのでしょうか。
実は,フィッシャーの考案した有意性検定とは別に統計的仮説...
後者は,フィッシャーの有意性検定に影響を受けて,ネイマン...
その違いについて,著者は以下のようにまとめています。
>…(中略)…フィッシャーの有意性検定とネイマン-ピアソンの...
<
ここで,②有意水準の事前決定という項目を見て驚かれる方もお...
そう,フィッシャーは有意水準という概念を考え出したのです...
どうしてこういうことになるかについては,少し長くなります...
>フィッシャーの有意性検定では,標本特性値と帰無仮説にもと...
<
つまり,フィッシャーは有意水準に照らしての判定という枠組...
むしろ,帰無仮説からどの程度離れているのかという乖離の“度...
この考え方は,現代における効果量による評価とか,区間推定...
一方で,ネイマン-ピアソンは効果の大きさを推定することを...
だから,検定が機械的な意思決定のもとになってしまうのでは...
>…(中略)…ネイマン-ピアソン理論の核心は,対立仮説(alte...
<
この違いは,フィッシャーとネイマン-ピアソンでは,その研...
フィッシャーは,先に述べたように,特定の肥料や品種の効果...
これに対して,ネイマン-ピアソンの研究の背景には,工場の...
この抜取検査が問題となる具体例として,例えば,弾薬検査が...
弾薬は時間がたつと劣化するので,使用可能な状態かどうかを...
しかし,これは破壊検査なので(検査した弾薬は使えなくなっ...
そこで,信頼性の高い抜取検査の方式を導入することが強く求...
さて,抜取検査では,無作為に抽出した標本をもとに[[ロット>...
ロットの一部である標本に基づいてロット全体の品質を推測す...
この場合,適正な,出荷して問題のないロットを間違って差し...
そこで,この誤りは生産者のリスクといえます。
一方,本当は質の悪い,不合格のロットを誤って合格と判定す...
こちら側は,買ってしまった消費者が損をするので,消費者の...
ここで,生産者のリスクが第Ⅰ種の過誤,消費者のリスクが第Ⅱ...
抜取検査では,これら2つのリスクをともに低く抑えることが...
生産者のリスクが大きすぎると商売が成り立ちませんし,消費...
最小限の検査費用で(生産者のリスク低),一定の品質の製品...
ネイマン-ピアソンは,これらのリスクを確率として実際に計...
生産者のリスクが有意水準(α)で,消費者のリスク(β)を1...
特定の肥料や品種が“どの程度の確かさで”収穫量に変化をもた...
不合格のロットから問題のない弾薬だけを選ぶ方法はないと思...
こうした発想が帰無仮説(品質に差がない=合格)か対立仮説...
また,ロットはひとつだけでなく,無数にあるのがふつうです。
それに,工場ですから同じラインを使って何度も製品を生産す...
そこで,検査はよく似た環境の中で何度も繰り返されることに...
これが一定の有意水準のもとで,できる限り検定力を高めると...
この点も,収穫のタイミングが多くはない,農事試験とは異な...
このようにみると,ネイマン-ピアソンの理論は最初からメタ...
現在の一般的な統計学の授業では,フィッシャーの理論とネイ...
しかし,上記のような背景にある思想や社会的要請の違いをあ...
個人的に長らく気になっているのは,“有意水準”と“有意確率”...
t検定や分散分析の手計算まで扱うタイプの授業やテキストの...
このやり方だと,受講者は有意確率というものを直接扱うこと...
ところが,統計ソフトを使うとp値(有意確率)という謎の値...
これでは,受講生が混乱しても仕方のないところがあるのでは...
その反動か,ソフトウェアの使い方だけ教えればいいというタ...
この場合,基準として5%という値を使うことは習っているは...
それでは,検定結果を評価するときには,有意水準や有意確率...
ここまでの議論から考えると,フィッシャー流に考えるなら“有...
おそらく,古典的な授業やテキストはネイマン-ピアソン流に...
それから,検定の結果に基づき帰無仮説と対立仮説のいずれか...
少なくとも,フィッシャーとネイマン-ピアソンという2つの...
最後に,ネイマン-ピアソンの統計的仮説検定理論についても...
ただし,ここでいう生産者とは軍部に製品を納入する業者であ...
これら二者の間には深刻な相互不信があると考えられていまし...
業者は検査官のチェックを厳しすぎるとみて信じない,あるい...
一方で,検査官は業者が粗悪品を流すのではないかと疑ったり...
そこで,立場を超えて,さらには,個人の判断を超えて適正な...
しかし,著者も述べていますが,この統計的仮説検定理論がど...
当時のアメリカの軍事生産局は,統計的品質管理の集中講義を...
この集中講義への参加資格は,当初は「以前に統計学を学んだ...
この理由については不明とのことですが,著者は集中講義の内...
そうすると,統計的仮説検定もまたコミュニケーションのツー...
ともあれ,分散分析や実験計画法,仮説検定の論理の社会的背...
また,いつの時代も,統計的分析について理解してもらうのは...
いろいろな方向から多くのものを受け取ることのできる本です。
----
芝村良 (2004). R. A. フィッシャーの統計理論:推測統計学の...
RIGHT:(2012-02-02)
&tag(統計);
終了行:
心理学や行動科学の統計解析で最もよく用いられる分析法のひ...
この分散分析を考案したのが統計学者の[[ロナルド・フィッシ...
今回,『R. A. フィッシャーの統計理論-推測統計学の形成と...
この本は,フィッシャーの統計理論を単純に紹介するのではな...
フィッシャーの分散分析がもともと農事試験の評価を行うため...
フィッシャーは各種の肥料や品種を使うことが作物の収穫量に...
しかし,この評価は化学などにおける試験とは違って容易では...
というのは,以下のような事情があったからです。
>…(中略)…統計的方法の適用対象としての農事試験は,基本的...
<
こうした,雑多な要因の影響の中で統制条件との比較から結論...
また,農事試験では(品種にもよると思いますが)一年に一回...
このデータ収集の問題も,行動科学におけるデータ収集の問題...
さて,フィッシャーの実験計画法及び分散分析がそれまでの農...
フィッシャー以前の農事試験では,試験(実験)における誤差...
実験にとって誤差は大敵です。
農事試験でも,同じ作物を同じように育てたとしても,その年...
そこで,極力,環境を同じにして誤差を最小限にしようとする...
しかし,フィッシャーの考え方は少し違っていました。
誤差を減らそうとするのではなく,誤差の程度を正確に推定し...
そして,この正確な推定という目的のためには,誤差を減らそ...
測定には誤差は常につきまとうもので,結局,これをなくすこ...
だったら,減らすのではなく,どの程度の誤差が生じたのかを...
そのような管理された実験条件を作るための方法論が実験計画...
これを実現するための3つの工程が,局所管理(local control...
例えば,圃場全体の肥沃度を均一にすることが難しい場合は,...
そして,このブロック内では肥沃度が均一になるようにします...
こうすれば,比較するブロック内の誤差は均質ですから,各ブ...
このように,実験計画法は一種の誤差管理術であったことがわ...
より妥当な誤差の推定値が得られたなら,条件(処遇)による...
ところで,統計的検定そのものは,フィッシャー以前にも既に...
しかし,フィッシャーとそれ以前とでは,検定に対する考え方...
フィッシャー以前では,誤差は観測の失敗と捉えられ,標本を...
そのため,検定というものを観測精度のよさの指標として用い...
例えば,フィッシャー以前にも,K. ピアソンのχ&SUP(){2};適...
ただし,ピアソンはこれを帰無仮説の棄却を目的として行って...
そうではなく,標本分布と理論分布の乖離が小さい,これらの...
χ&SUP(){2};値が高い場合には「偏っている」,小さい場合には...
芝村はこれを以下のように評しています。
>有意水準という一定の判定基準を有しないことが,適合度の査...
<
フィッシャーは標本分布と理論分布の乖離の程度から条件(処...
乖離がどのくらい小さいか,つまり,データがどのくらいフィ...
また,そのためか,判定基準というものもなく,帰無仮説の設...
ちなみに,差がある方ではなく,ない方に注目するという点で...
χ&SUP(){2};検定の名で現在一般にイメージされるような分割表...
それでは,フィッシャーの方は,どうして帰無仮説を立ててこ...
著者は,フィッシャーの有意性検定の意義を,農事試験の専門...
フィッシャー以前は,農事試験の成果は,専門家の経験に基づ...
ここでいう専門家とは,農業に携わって生計を立てる人ではな...
この専門家の人々は,農事試験の結果に基づいて,新たな肥料...
一般の農業従事者からすれば,自分たちの実感から離れた環境...
自分たちにわからない基準で“専門家”が判定した結果を信じな...
そこで,誰にでも納得のいく,客観的な判定の基準がほしいと...
この基準こそが“有意水準”であり,例の5%とか1%の数値に...
フィッシャーは,実験計画法を考案しただけでなく,この判定...
有意水準や帰無仮説といった概念,そして,有意性検定は,そ...
しかし,有意性検定は,本当に著者の言うように「実験結果の...
本書でも紹介されていますが,有意性検定の普及の背後には,...
現代の日本の大学でも,心理学等の専攻では統計の授業が必修...
そこから推しても,当時の“伝道者”の人たちの努力は並々なら...
この努力は,サイエンス・コミュニケーションの観点から評価...
当時は,このように,ある意味理想的な形で有意性検定という...
しかし,有意性検定を利用している現代の科学者の多くは“非専...
5%の基準に頼っていれば,効果に意味があるのかどうかいち...
あるいは,“専門家と非専門家の”ではなく,“専門家の間での有...
つまり,“5%”で有意だったんだから文句ないだろう,という...
フィッシャーは,この点をどのように考えていたのでしょうか。
実は,フィッシャーの考案した有意性検定とは別に統計的仮説...
後者は,フィッシャーの有意性検定に影響を受けて,ネイマン...
その違いについて,著者は以下のようにまとめています。
>…(中略)…フィッシャーの有意性検定とネイマン-ピアソンの...
<
ここで,②有意水準の事前決定という項目を見て驚かれる方もお...
そう,フィッシャーは有意水準という概念を考え出したのです...
どうしてこういうことになるかについては,少し長くなります...
>フィッシャーの有意性検定では,標本特性値と帰無仮説にもと...
<
つまり,フィッシャーは有意水準に照らしての判定という枠組...
むしろ,帰無仮説からどの程度離れているのかという乖離の“度...
この考え方は,現代における効果量による評価とか,区間推定...
一方で,ネイマン-ピアソンは効果の大きさを推定することを...
だから,検定が機械的な意思決定のもとになってしまうのでは...
>…(中略)…ネイマン-ピアソン理論の核心は,対立仮説(alte...
<
この違いは,フィッシャーとネイマン-ピアソンでは,その研...
フィッシャーは,先に述べたように,特定の肥料や品種の効果...
これに対して,ネイマン-ピアソンの研究の背景には,工場の...
この抜取検査が問題となる具体例として,例えば,弾薬検査が...
弾薬は時間がたつと劣化するので,使用可能な状態かどうかを...
しかし,これは破壊検査なので(検査した弾薬は使えなくなっ...
そこで,信頼性の高い抜取検査の方式を導入することが強く求...
さて,抜取検査では,無作為に抽出した標本をもとに[[ロット>...
ロットの一部である標本に基づいてロット全体の品質を推測す...
この場合,適正な,出荷して問題のないロットを間違って差し...
そこで,この誤りは生産者のリスクといえます。
一方,本当は質の悪い,不合格のロットを誤って合格と判定す...
こちら側は,買ってしまった消費者が損をするので,消費者の...
ここで,生産者のリスクが第Ⅰ種の過誤,消費者のリスクが第Ⅱ...
抜取検査では,これら2つのリスクをともに低く抑えることが...
生産者のリスクが大きすぎると商売が成り立ちませんし,消費...
最小限の検査費用で(生産者のリスク低),一定の品質の製品...
ネイマン-ピアソンは,これらのリスクを確率として実際に計...
生産者のリスクが有意水準(α)で,消費者のリスク(β)を1...
特定の肥料や品種が“どの程度の確かさで”収穫量に変化をもた...
不合格のロットから問題のない弾薬だけを選ぶ方法はないと思...
こうした発想が帰無仮説(品質に差がない=合格)か対立仮説...
また,ロットはひとつだけでなく,無数にあるのがふつうです。
それに,工場ですから同じラインを使って何度も製品を生産す...
そこで,検査はよく似た環境の中で何度も繰り返されることに...
これが一定の有意水準のもとで,できる限り検定力を高めると...
この点も,収穫のタイミングが多くはない,農事試験とは異な...
このようにみると,ネイマン-ピアソンの理論は最初からメタ...
現在の一般的な統計学の授業では,フィッシャーの理論とネイ...
しかし,上記のような背景にある思想や社会的要請の違いをあ...
個人的に長らく気になっているのは,“有意水準”と“有意確率”...
t検定や分散分析の手計算まで扱うタイプの授業やテキストの...
このやり方だと,受講者は有意確率というものを直接扱うこと...
ところが,統計ソフトを使うとp値(有意確率)という謎の値...
これでは,受講生が混乱しても仕方のないところがあるのでは...
その反動か,ソフトウェアの使い方だけ教えればいいというタ...
この場合,基準として5%という値を使うことは習っているは...
それでは,検定結果を評価するときには,有意水準や有意確率...
ここまでの議論から考えると,フィッシャー流に考えるなら“有...
おそらく,古典的な授業やテキストはネイマン-ピアソン流に...
それから,検定の結果に基づき帰無仮説と対立仮説のいずれか...
少なくとも,フィッシャーとネイマン-ピアソンという2つの...
最後に,ネイマン-ピアソンの統計的仮説検定理論についても...
ただし,ここでいう生産者とは軍部に製品を納入する業者であ...
これら二者の間には深刻な相互不信があると考えられていまし...
業者は検査官のチェックを厳しすぎるとみて信じない,あるい...
一方で,検査官は業者が粗悪品を流すのではないかと疑ったり...
そこで,立場を超えて,さらには,個人の判断を超えて適正な...
しかし,著者も述べていますが,この統計的仮説検定理論がど...
当時のアメリカの軍事生産局は,統計的品質管理の集中講義を...
この集中講義への参加資格は,当初は「以前に統計学を学んだ...
この理由については不明とのことですが,著者は集中講義の内...
そうすると,統計的仮説検定もまたコミュニケーションのツー...
ともあれ,分散分析や実験計画法,仮説検定の論理の社会的背...
また,いつの時代も,統計的分析について理解してもらうのは...
いろいろな方向から多くのものを受け取ることのできる本です。
----
芝村良 (2004). R. A. フィッシャーの統計理論:推測統計学の...
RIGHT:(2012-02-02)
&tag(統計);
ページ名:
ツイート