構造因果モデル

1.5.1因果仮定のモデル化

前回の記事では、有向アシクリカルグラフについて説明しました。 このセクションでは、Dagを使用して、モデルの因果関係の仮定を推論する方法を学びます。

数学的には、構造因果モデル(SCM)は、内因性(V)のセットと、Uの変数の値に基づいてVの変数の値を決定する関数(F)のセットによって接続された外因性(U)変数のセットで構成されています。直感的には、DAGが情報の流れを表すと考えると、変数Uはシステムへの入力であり、変数Vはその情報が処理されるノードです。

各SCMは、各ノードがUまたはVの変数であり、各エッジが関数fであるグラフィカルモデル(DAG)に関連付けられています。

  • 変数Yが変数Xの子である場合、YはXによって引き起こされる、またはXがYの直接の原因であると言います。
  • 変数Yが変数Xの子孫である場合、YはXによって潜在的に引き起こされるか、XがYの潜在的な原因であると言います。

図1.9の例を考えてみましょう。

図1.9—scm1.5.1のグラフィカルモデル

単にこのグラフを見てから、我々はすぐに直感的に、基礎となるscmの詳細の多くを把握:

  • XとYには入ってくるエッジがないので、外生変数(Uに属する)です。
  • Zは2つの入ってくるエッジを持っているので、それは内生変数(Vに属する)です。つまり、Zの値はXとYの値とfz=f(x,Y)に明示的に依存します。
  • Zは二つの直接的な原因XとYを持っています。
  • Zの値はXとYの値に明示的に依存し、fz=f(x,Y)。

しかし、Zの値を決定する関数fzが何であるかを正確に知るためには、SCMの完全な仕様が必要です。:DIV>

SCM1.5.1

モデルのシミュレーション

完全に指定されたSCMの利点の一つは、シミュレーションが非常に簡単であることです。 たとえば、上記のSCM用の偽の(決定論的な)データを作成できます。

X、Y、Zの値を持つ単純なpandas DataFrameを生成します。

この例に特に感銘を受けていない場合、私はあなたを許します。 結局のところ、私たちがした唯一のことは、単純な方程式に基づいて偽のデータを生成することでした。 これは、表面の少し下を見るまで、特に印象的ではありません。

このデータフレームは、モデルの完全な数値的な説明を表しています…言い換えれば、これは、関数fzに合うように、上記のDAGと組み合わせて使用されていた元のデータのおもちゃのバージョンです。

このデータフレームを”経験的データ”として扱い、fzがXとYの線形回帰であると仮定すると、Z~X+Yを単純に近似することができます。

このデータフレームを”経験的データ”として扱い、fzがxとYの線形回帰であると仮定すると、Z~X+Y:

それぞれxおよびy:div>

私たちは多くの中で見ていきます後で因果モデルを評価して適合させる方法の詳細がわかりますが、この単純なおもちゃのモデルでさえ、すでに何が来るのか、このアプローチの単純さ(

確率的な例

今、より複雑な例、SCM1.5.3を見てみましょう。 この場合、SCMは次式で与えられます:

SCM 1.5.3

From this specification, we can easily obtain the corresponding DAG:

Graphical Model for SCM 1.5.3

We are also told that all exogenous variables are independently distributed with an expected value zero. これは,外生変数がモデル内の観測されていない影響に対応することを意味し,それらは誤差因子として扱われる可能性があることを意味する。

Ux、Uy、Uzの正規分布ランダム値をプラグインすると、X、Y、Zの値を指定するデータフレームをすばやく作成できます。

内生変数の値を生成し、データフこのモデルの動作について質問がある場合は、上記の手順と同様の手順で回答できます。

: 観測された値が独立変数であり、未知数が従属変数である線形モデルの近似(すべての依存関係が線形であると仮定しているため)。

たとえば、Yの特定の値に対するZの値が何であるかを知りたい場合は、単にZ~Yを近似し、Yの対応する値をプラグインします。Y=3の場合、zの期待値は0.189261であり、上記のfZの式でY=3をプラグインすることで簡単に検証できます(z=3/16であることがすぐにわかります)。一方、Y=3を観測することに加えて、X=1も観測する場合、Zの値はどうなりますか? この近似を実行すると、次のようになります。

ここで、yとxの係数を読み取ることができます。xとyの値をプラグインすると、上記で得られた値と同様のz=0.189821が得られます。

上記の要約表を見ることで、これが結果になると推測できました。 我々は、Xの係数が0.0053±0.003であり、実質的に無視できるゼロに非常に近いことをシードします。これは驚くべきことに思えるかもしれませんが、このクラスのモデルが非常に強力である主な理由の1つです。

特定の内生変数の値は、その親の値にのみ依存することができます

この単純な観察は、私たちが興味を持っているものの親の中にない変数を無視することによって、計算を大幅に簡素化できることを意味します。私たちの次のトピックに私たちを導く…

1.5.2Product decomposition

私たちは、単純でありながら強力なルール、本で定義されている”Product decompositionのルール”を定義するために、上:

グラフが非循環である任意のモデルでは、モデル内の変数の共同分布は、グラフ内のすべての”家族”に対する条件付き分布P(子|親)の積div>

すぐに書くことができます:p>

これは、代わりにx、y、xの可能な組み合わせごとに観測値の大きなテーブルx、y/x、z/yには、同じ情報が含まれ、はるかに簡単に取得できる非常に小さいテーブルが必

さらに重要なのは、グラフィカルモデルでは、各変数の基礎となる関数について明示的に何も知らなくても、この分解を記述することができます。

In general, we write:

Let us now consider the example in Fig 1.10:

DAG from Fig 1.10 with the associated probability tables.

From this figure, we can immediately write:

and:

Which could also be obtained from the definition of the conditional probability P(X|Z). We can further write:

by the theorem of total probability. And if we plugin the values from the conditional probability tables above, we obtain:

And, similarly:P>

最後に、我々は推定することができます差p(y=1/x=1)-p(y=1/x=0)を計算することによって、薬物(x=1)を服用した死亡率(y=1)に及ぼす影響。 (Z=1)および(Z=0)疾患のない集団については、次のようになります。:div>

たちは、xとZの両方に条件付けています:私たちは、各個人が特定の集団(Z)に属し、投薬(X)を服用するかどうかを課しています。一方、母集団全体の平均効果だけが必要な場合は、治療(X)だけを条件付ける必要があります。

一方、母集団全体の平均効果だけが必要な場合は、治療(X) この場合、P(Y=1|X=1)-P(Y=1|X=0)を計算します。 この式を次のように書き直します:

Where we can easily plugin the expressions defined above.

コメントを残す

メールアドレスが公開されることはありません。