MPT モデルによるソースモニタリングデータの分析/MPTモデルの構築とパラメータ制約 - 井関龍太のページ

ホーム   編集 凍結 差分 バックアップ 添付 コピー 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS

MPT モデルによるソースモニタリングデータの分析/MPTモデルの構築とパラメータ制約

Last-modified: 2013年09月28日 (土) 18:56:39 (1871d)
Top > MPT モデルによるソースモニタリングデータの分析 > MPTモデルの構築とパラメータ制約

モデルの構築

MPTモデルによる分析では,データの構造と研究者の仮定する理論に基づいて,分析ごとに適切なモデルを構築する必要があります。
この点は構造方程式モデリング(SEM)に似ています。

ただし,ソースモニタリングデータの扱いに関していえば,よく使用されているモデルをそのまま使うか,少しアレンジすることで対応できる場合がほとんどではないかと思います。
これは,実験を通してデータ構造と研究者が仮定するであろう理論が似ていることによります。

一般的に用いられるソースモニタリングモデルでは,まず,項目の種類ごとに別々のモデルを構築し,分析の際にそれらをセットにして扱います。
ソースが2種類の場合には,ソースA項目とソースB項目があり,さらに,新項目もあるので,この3つについてそれぞれモデルを作ります(ジョイントMPTモデル)。

ソースA項目についてのモデルは,以下のように図に表わすことができます。

tree_sA.png

ここで,図中の文字は以下のことを表すものとします。

検出可能性旧項目を正しく「旧項目」であると判断する確率
ソース弁別可能性項目のソースを正しく判断する確率
反応バイアス正しく検出できなかった項目を「旧項目」であると判断する確率(フォルスアラーム)
推測率1正しく検出した項目を推測に基づいて「ソースA項目」であると判断する確率
推測率2正しく検出できなかった項目を推測に基づいて「ソースA項目」であると判断する確率
ソースA反応「ソースA項目」であるという判断
ソースB反応「ソースB項目」であるという判断
新反応「新項目」であるとという判断

A,B,Nは実際の反応頻度(を仮定的に場合分けしたもの)であるのに対して,その他の文字は潜在変数(パラメータ)を表すことに注意してください。
これらのパラメータはいずれも確率変数なので0~1の値を取ります。
「1-x」のようになっている場合は,反応経路がxであるか1-xであるかのいずれかであり,これらの確率を足すと1になることを仮定しています。

この図の枝別れの構造は,ソースモニタリング実験の判断の過程を反映しています。
実験のテスト段階を思い出してみてください。
(1)学習段階で提示されたものか否かをまず判断し(再認判断),旧判断がなされたら,(2)文脈Aで提示されたか文脈Bで提示されたかを判断していました(ソース判断)。
図中のプロセスもこれに対応しています。

まず再認判断を行ってから,旧判断の場合(D)はソース判断に進みます。
ここで,正しくソースを思い出せれば(d)正しい反応が行えます(A)。
しかし,旧項目であることはわかったけれど,ソースがどちらか思い出せない,ということもあるはずです(1-d)。
この場合もヤマ勘で正しい反応が行える可能性はあります(a→A)。
しかし,それが外れる場合もあるでしょう(1-a→B)

再認で誤った場合には(1-D),それが旧項目であると推測する場合(b)とそうでない場合があります(1-b)。
旧項目であると思った場合には,さらに,それがソースA項目であると思うか(g),そうでない=ソースB項目であると思うか(1-g)のいずれかでしょう。

さて,ソースB項目についても同様のモデルを作ります。

tree_sB.png

反応のパターンはソースA項目の場合とまったく同じなので,モデルの構造も同じです。
ただし,添え字が変わっていることに注意してください。
ソースA項目とソースB項目で検出可能性やソース弁別可能性その他のパラメータの値が異なる可能性を表すため,添え字で区別しています。

新項目については,反応のパターンが異なるので,図は以下のようになります。

tree_new.png

以上3つのツリーをセットにすることで,反応選択肢が3つの場合のソースモニタリングデータを分析するためのモデルとなります。

さて,以上のモデルを文字式で表すことができます。
文字式を作るには,各反応に行きつく経路をたどり,経路上のすべての文字をかけ算します。
このようにしてできた項を,同じ反応に行きつくもの同士足して式を作ります。
例えば,上のソースA項目の場合,反応はソースA反応,ソースB反応,新反応の3種類なので,以下のように書けます。

p11 = D1d1 + D1(1-d1)a + (1-D1)bg
p12 = D1(1-d1)(1-a) + (1-D1)b(1-g)
p13 = (1-D1)(1-b)

同じようにして,ソースB項目,新項目のモデルも式に直すことができます。

p21 = D2d2 + D2(1-d2)a + (1-D2)bg
p22 = D2(1-d2)(1-a) + (1-D2)b(1-g)
p23 = (1-D2)(1-b)
p31 = bg
p32 = b(1-g)
p33 = (1-b)

文字式による表現は,ソフトウェアによってはモデルを指定する際に必要になることがあるので,とりあえず使わないとしても,作り方を知っておいた方がよいと思います。

パラメータの制約

さて,ようやくモデルも作り終えたことだし,いざ分析と行きたいところですが,その前にもうひとつ注意すべき点があります。
それは,モデルの識別に関わる問題です。
MPTモデルでは,モデル式に対して推定しようとしているパラメータが多すぎると連立方程式を一意に解くことができず,分析不能に陥ることがあります(SEMと同じですね)。

実は,先のソースモニタリングモデルは,そのままでは識別不能なモデルです。
モデル式の数は6なのでモデルの自由度は6ですが,パラメータは7個あります(D1,D2,d1,d2,a,g,b)。
では,どのように変更したら分析を行えるようになるのでしょうか。
識別不能な場合には,実質科学的な見地から妥当な仮定を置くことによって,推定すべきパラメータを減らすのが一般的な方法でしょう。

Batchelder & Riefer(1990)は,ソースモニタリング研究の文脈において受け入れられるであろう制約のパターンを考慮して,先のソースモニタリングモデルの7つのサブモデルを紹介しています。
これらのサブモデルは,構造はすべて同じですがパラメータに対する制約のパターンが違っています。
これらは以下の制約のいずれを組み込むか,いくつ組み込むかのバリエーションからできているます。

1. D1 = D2
2. d1 = d2
3. a = g

1は検出可能性,すなわち,再認困難度がソースAとソースBで異ならないという制約です。
これは,妥当な材料選びや実験操作がなされているのであれば,それほど不自然な仮定ではないでしょう。
ただし,伝統的な分析法の問題点として挙げたように,ソースごとの違いに興味があるのであればこの仮定を置かない方がよいでしょう。

2はソース弁別可能性について同様の仮定を行っています。
3は推測率を旧項目の検出に成功した場合と失敗した場合で区別しないという仮定です。
検出の成否を特に区別する必要がないのであれば,この制約を置くことに特に問題はなさそうです。
Excelを使ったMPTモデリングの方法を解説したDodson et al.(1998)では,データを適合させるためのパラメータが少ないモデルを採用するという方略を提案しており,3つすべての制約を置いたモデルを使った分析例を紹介しています。
このページでもこの方針にしたがって進めることにします。

TrackBack(0) | 外部リンク元 | このエントリーをはてなブックマークに追加

添付ファイル: filetree_sB.png 119件 [詳細]   filetree_sA.png 132件 [詳細]   filetree_new.png 106件 [詳細]