MPT モデルによるソースモニタリングデータの分析/ソフトウェアによるパラメータ推定 - 井関龍太のページ

ホーム   編集 凍結 差分 バックアップ 添付 コピー 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS

MPT モデルによるソースモニタリングデータの分析/ソフトウェアによるパラメータ推定

Last-modified: 2013年09月28日 (土) 18:31:40 (1871d)
Top > MPT モデルによるソースモニタリングデータの分析 > ソフトウェアによるパラメータ推定

パラメータ推定の手順

それでは,いよいよ具体的な分析方法の説明に入ります。
MPTモデルの推定ができるソフトウェアはいくつかありますが,ここでは,multiTree(Moshagen, 2010)というソフトを使った場合の手順を主に紹介します。

まず,PCにmultiTreeをインストールする必要があります。
ホームページ(http://psycho3.uni-mannheim.de/index.php?n=Main.MultiTree)からインストーラをダウンロードして実行すれば,特に問題なくインストールできると思います。
インストールしたら,アイコンをダブルクリックしてソフトウェアを起動します。

(1)モデルの定義
multiTreeには,モデル定義のための手段として(a)GUIによる方法と(b)式を入力する方法の2つがあります。
GUIは直感的でわかりやすいのですが,(b)の式入力による方法も使えるようになっておくことをお勧めします。
というのは,multiTreeの分析で使うモデル式のファイルは,multiTree以外のソフトでも使えるからです。
Moshagen(2010)が表にまとめていますが,MPTモデルのためのソフトウェアは少しずつ機能が違っており,場合によっては別のソフトにまたがって分析を行う必要も出てくるかもしれないからです。

(a)model builder(GUI)を使う方法
まず,メニューバーの“Model”を選択して,現れたメニューの中から“Open Model Builder”を選択します。
すると,“Model Builder”タブが表示されます(長方形が表示された“お絵かき”画面になります)。
この画面でできることは以下の通りです。

  • “+”ボタンでノードを増やす
  • “-”ボタンでノードを消す
  • “s”ボタンでノードが潜在変数を表すか反応カテゴリーを表すかを切り替える
  • ダブルクリックでノードやリンクの名前を変更する
  • 定義を終えたら,“Update equations”ボタン(書類の形をしたアイコン)をクリックする

これらの操作を繰り返すことによって,自分の分析したいモデルを描いていきます。
例えば,最初の長方形からノードを増やすことで(まずはD1,それからd1),ソースモニタリングモデルの形に展開していきます。
展開していった末端のノードを反応カテゴリー(A,B,N)にすることを忘れないようにしましょう。
最後に“Update equations”ボタンを押すと,作成したモデルが“Equations”タブに反映されます。
(プログラム的には作図した絵ではなく,“Equations”タブの方程式に基づいて分析を行っているものと思われます。また,“Model Builder”タブの中から既存の方程式ファイルをインポートすることもできます)。

このようにして1つのツリーを作り終えたら,次のツリーを作ります(ソースモニタリングモデルでは3つのツリーがあります)。
ツリーを増やすには,“Model Builder”タブ右下の“Add new tree”ボタンを押します。

・・・が,なぜかWindows 7では“Add new tree”ボタンそのものが表示されません。
(Windows 7で確認したのは2台のマシンだけなのですが,その他のWindows XPマシンではすべて正常でした。互換モードを使っても効果はないようです。)
“Add new tree”ボタンが表示されない場合は,以下の方程式入力の方法を使うことで分析は通常通り行うことができます。
追記
この“Add new tree”ボタンが表示されない問題は,version 0.43では解決されたようです。

(b)“Equations”タブに直接方程式を入力する
“Equations”タブの中に自分で方程式を入力します。
通常のテキストと同様にキーボードで入力を行います。
書式は,以下のように決まっています。

  • 1行目・・・すべてのツリーの方程式の合計数を記述する
  • 2行目以降
    • 1列目・・・ツリーの違いを表すラベル(文字も使えるが数値が好ましい)
    • 2列目・・・反応カテゴリーの違いを表すラベル(文字も使えるが数値が好ましい)
    • 3列目・・・方程式

列と列の間はスペースで区切ります。
具体的には,ソースモニタリングモデルの場合は,以下のようになります。

15
1 1 D1*d1
1 1 D1*(1-d1)*a
1 2 D1*(1-d1)*(1-a)
1 1 (1-D1)*b*g
1 2 (1-D1)*b*(1-g)
1 3 (1-D1)*(1-b)
2 5 D2*d2
2 4 D2*(1-d2)*a
2 5 D2*(1-d2)*(1-a)
2 4 (1-D2)*b*g
2 5 (1-D2)*b*(1-g)
2 6 (1-D2)*(1-b)
3 7 b*g
3 8 b*(1-g)
3 9 (1-b)

この書式の方程式は,multiTreeの中で作るのではなく,予めテキストファイルで作っておいて読み込む形でも使えます。
ただし,ファイルの拡張子を“.eqn”の形式にする必要があります。
eqn形式のファイルは,メニューバーの“File”から“Open multiTree File”を選択し,ダイアログの中から目的のファイルを選べば読み込むことができます。
このeqn形式のファイルは,GPT.exe(Hu & Phillips, 1999)やHMMTree(Stahl & Klauer, 2007)といった他のMPTモデルのソフトでも使用できます。

(2)データセットの入力
モデルの定義が終わったら,次はデータを入力します。
"Data"タブにキーボードで入力を行います。
書式は,以下の通りです。

  • 1行目・・・タイトル(任意の名前)
  • 2行目以降
    • 1列目・・・反応カテゴリーの違いを表すラベル
    • 2列目・・・反応頻度
  • 最終行・・・“===”を入力する

ここで,反応カテゴリーのラベルは,モデル方程式で使ったカテゴリーラベルと一致させる必要があります(つまり,同じ値にしなければなりません)。
反応頻度は,そのセルに該当する反応の数を合計したもので,ここが実験で収集した,ふつうの意味でのデータに相当します。

このデータファイルは,方程式のeqnファイルと同様に,予めテキストファイルで作っておいて読み込むこともできます。
拡張子は“.mdt”です。
読み込みの方法は,eqnファイルの場合と同じで,メニューバーの“File”から“Open multiTree File”を選択し,ダイアログの中から目的のファイルを選びます。

ちなみに,先に挙げたデータをこの形式で書くと以下のようになります。

example
1 612
2 151
3 77
4 123
5 643
6 74
7 19
8 18
9 383
===

(3)パラメータの制約
モデルを指定し,データも読み込んだら,次はパラメータの制約を行います。
“Parameters”のタブを開いてみてください。
モデルで指定した潜在変数が並んでいるはずです。
デフォルトでは,どのパラメータも“free”になっています。

パラメータを制約するには,この“free”になっているボタンを押して,展開されたメニューからオプションを選択します。
例えば,“D1 = D2”という制約を置くとします。
この場合,“D2”の隣のボタンを押し,オプションから“= D1”を選択します。
ボタンの表示が“= D1”になれば成功です。
“D1”の側はパラメータを推定するので,“free”のままにしておきます。
同様のやり方で,“d1 = d2”や“a = g”の制約も置くことができます。

また,“constant”を選ぶと定数を指定することもできます。
このときは,ボタン右側のウィンドウの中に固定したい数値を入力します。

(4)“Analyze”ボタンを押す
パラメータの制約が終わったら,後は分析ボタンを押すだけです。
メニューバーの下にある緑の矢印をクリックしてください(または,メニューバーの“Analysis”から“Run analysis”を選択)。
結果が出力されるはずです(保存するか尋ねられたら,YESかNOを選択してください)。

(5)モデル適合の評価
さて,結果が出力されたら今度はそれを評価することになります。
上から順に見ていきましょう。

まず,“Model Fit”のセクションの最初にPDλが表示されています。
これはpower divergence統計量と呼ばれ,モデルとデータの解離の度合いを表す指標です。
一般には,MPTモデルの評価は,G2によってなされます。
G2はカイ二乗分布に近似する指標なので,そのままカイ二乗値として解釈できます。
multiTreeではより一般的な指標であると思われるPDλを用いていますが,この値はλ=0のときG2に一致するので,やはりカイ二乗値として見ることができます(λの値はオプションで変更できます)。
論文にはG2として記述した方がよいでしょう。
この値の隣にモデルの自由度(df)とカイ二乗検定のp値が表示されています。
SEMの場合と同様に,この検定は有意でないときに,モデルが適合していることを示します。
すなわち,検定の結果が有意でなければ,指定したモデルと実際のデータの間に有意な解離が見られなかったと解釈できます。

その次のln(likelihood) は,Moshagen(2010)ではっきりと述べられていないようなので,ちょっとわかりません。
おそらく尤度ではないかと思いますが・・・。

その後には,情報量基準が並びます。
これもSEMでおなじみの指標ですね。
AICとBICは,複数のモデルを比較するときに使います。
相対的に見て,より値の低いモデルがより適合したモデルです。
⊿AICと⊿BICは,飽和ヌル仮説モデルとの比較を主眼に置いた指標とのことで,正=モデルを棄却すべき,負=モデルを支持すべきであることを示唆するそうです。

“Parameter Estimates”のセクションには,各パラメータの推定値が並びます。
()内はたぶん“asymptotic variances”で,[]内は信頼区間だと思われます。
MPTモデルでは,パラメータはツリーの各分岐での確率を表すので,値が大きいほど分岐の一方の方向が選ばれやすいことを示していると思われます。

TrackBack(0) | 外部リンク元 | このエントリーをはてなブックマークに追加