Strukturální Kauzální Modely

1.5.1 Modelování Kauzálních Předpokladů

V předchozím příspěvku jsme probrali, Režie Acyclical Grafy. V této části, dozvídáme se, jak můžeme pomocí dag uvažovat o příčinných předpokladech v našich modelech.

Matematicky, Strukturní Kauzální Model (SCM) se skládá ze sady Endogenní (V) a sadu Exogenní (U) proměnné jsou propojeny sadu funkcí (F), které určují hodnoty proměnných, v V. na základě hodnot proměnných v Usa

Intuitivně, pokud si myslíme, že DAG tak, že představuje tok informací, pak proměnné U jsou vstupy do systému, zatímco proměnné V jsou uzly, kde se zpracovávají informace.

Každý SCM je spojena s grafickým modelem (DAG), kde každý uzel je proměnná v U nebo V a každá hrana je funkce f. Každá hrana (funkce) odpovídá kauzální předpoklad:

  • v Případě, že proměnná Y je dítě proměnné X, pak řekneme, že Y je způsobeno tím, že X, nebo že X je příčinou Y.
  • v Případě, že proměnná Y je potomek proměnnou X, pak řekneme, že Y je potenciálně způsoben X, nebo že X je potenciální příčinou Y.

podívejme se na příklad na Obr 1.9:

Obr 1.9 — Grafický model SCM 1.5.1

jednoduše při pohledu na tento graf, okamžitě a intuitivně pochopit spoustu detailů hlubších SCM:

  • X a Y nemají žádné příchozí hrany, takže jsou to exogenní proměnné (patřící do U).
  • Z má dvě příchozí hrany, takže je to endogenní proměnná (patřící do V).
  • Z má dva přímé příčiny X a Y, nebo, jinými slovy, hodnota z závisí explicitně na hodnotách X a Y a fz=f(X, Y).

Nicméně, my potřebujeme plnou specifikaci SCM přesně vědět, co je funkce fz, která určuje hodnota Z. Strukturní Kauzální Model je pouze plně uvedeno, kdy, kromě DAG výše, jsme také určit:

SCM 1.5.1

Zde je důležité poznamenat, že, i když Psy obsahují méně informací, než plně uvedeno SCM, oni jsou často více užitečné. Grafy jsou extrémně vizuální objekty, což je usnadňuje interpretaci a analýzu. Často se také stává, že prostě nemáme dostatek informací, abychom plně specifikovali SCM, ale můžeme intuitivně definovat, jak by měl kauzální graf vypadat.

Simulace modelů

jednou z výhod plně specifikovaného SCM je, že jsou poměrně snadno simulovatelné. Například, můžeme vytvořit nějaký falešný (deterministický) údaje o SCM je popsáno výše:

Což vytváří jednoduché pandy Datovém s hodnotami X, Y a Z:

Odpouštím ti, pokud nejsou zvláště dojem tím, že tento příklad. Po všem, jediné, co jsme udělali, bylo vygenerovat falešná data na základě jednoduché rovnice. To není nijak zvlášť působivé, až se podíváme trochu pod povrchem,

Tento Datovém představuje plně číselný popis náš model… jinými slovy, je to hračka verzi toho, co se původní data, která mohla být použita ve spojení s DAG výše, aby se vešly funkce fz.

Pokud budeme považovat tento Datovém jako naše „empirických dat“ a budeme předpokládat (na základě nějaké znalosti domény), že fz by měl být lineární regrese X a Y, pak můžeme jednoduše fit Z ~ X + Y:

obnovit jako koeficienty vynásobením X a Y, resp.:

Podíváme mnohem podrobněji na to, jak hodnotit a fit Kauzální Modely později, ale i tento jednoduchý hračka model již nám poskytuje chuť, co přijde a jednoduchost (a obecnost) tohoto přístupu.

stochastický příklad

podívejme se nyní na složitější příklad, SCM 1.5.3. V tomto případě je SCM dán:

SCM 1.5.3

From this specification, we can easily obtain the corresponding DAG:

Graphical Model for SCM 1.5.3

We are also told that all exogenous variables are independently distributed with an expected value zero. To znamená, že exogenní proměnné odpovídají nepozorovaným vlivům v našem modelu, takže je lze považovat za chybové faktory.

Připojením normálně rozdělených náhodných hodnot Ux, Uy a Uz můžeme rychle vybudovat Datovém zadáním hodnot X, Y a Z.

zapomeňme na chvíli, že máme explicitní analytické formule, které produkují hodnoty endogenních proměnných a použít jen číselné hodnoty v našem Datovém.

jakékoli otázky, které bychom mohli mít ohledně chování tohoto modelu, mohou být zodpovězeny podobným postupem, jaký byl použit výše: montáž lineární model (protože předpokládáme, že všechny závislosti jsou lineární), kde naše zjištěné hodnoty nezávislé proměnné a naše neznámé jsou závislé proměnné.

například, pokud chceme vědět, co je hodnota Z může být pro konkrétní hodnotu Y, prostě jsme fit Z ~ Y a pak plugin odpovídající hodnoty Y. Pokud Y=3, pak očekávaná hodnota Z je 0.189261, jak lze snadno ověřit připojením Y=3 do výrazu pro fZ výše (kde jsme se rychle vidět, že Z=3/16).

na druhé straně, jaká by byla hodnota Z, pokud kromě pozorování Y=3 také pozorujeme, že X=1? Odpověď na tuto otázku bychom se mohli vejít Z~X+Y. Když jsme se provést tento fit, získáme:

Kde můžeme číst off koeficienty pro Y a X. Pokud bychom nyní připojit hodnoty X a Y, získáme Z=0.189821, které je podobné hodnoty získané výše.

mohli jsme tušit, že to bude výsledek při pohledu na souhrnnou tabulku výše. Předpokládáme, že koeficient Pro X je 0,0053±0,003, takže je velmi blízko nule, prakticky zanedbatelný.

i když se to může zdát překvapivé, je to jeden z hlavních důvodů, proč je tato třída modelů tak silná.

hodnota specifické endogenní proměnná může záviset pouze na hodnotách svých rodičů,

Toto jednoduché pozorování znamená, že si můžeme zjednodušit výpočty výrazně tím, že ignoruje všechny proměnné, které nejsou mezi rodiči na jedné máme zájem.

Což nás vede k naší další téma…

1.5.2 Produkt rozkladu

můžeme vybudovat na naší pozorování výše, definovat jednoduchý, ale výkonný pravidlo, že „Právní Produkt rozkladu“, který je definován v knize jako:

Pro každý model, jehož graf je acyklický, společnou distribuci proměnných v modelu je dána produktem podmíněné rozdělení P(dítěte nebo rodiče) přes všechny „rodiny“ v grafu

pro jednoduché řetězce graf:

můžeme okamžitě psát:

To znamená, že místo velké tabulky pozorování pro všechny možné kombinace X, Y a X. potřebujeme jen mnohem menší stoly pro X, Y|X, Z|Y, která bude obsahovat stejné informace a jsou mnohem více snadno získat.

co je důležitější, grafické modely nám umožňují napsat tento rozklad, aniž byste museli jednoznačně vědět něco o základní funkce každé proměnné.

In general, we write:

Let us now consider the example in Fig 1.10:

DAG from Fig 1.10 with the associated probability tables.

From this figure, we can immediately write:

and:

Which could also be obtained from the definition of the conditional probability P(X|Z). We can further write:

by the theorem of total probability. And if we plugin the values from the conditional probability tables above, we obtain:

And, similarly:

a Konečně, můžeme odhadovat, že vliv na úmrtnost (Y=1) užívání drog (X=1) výpočtem rozdílu P(Y=1|X=1),-P(Y=1|X=0). Pro populaci s (Z=1) a bez (Z=0) onemocnění máme:

Zde by mělo být jasné, proč jsme klimatizaci na obou X a Z: jsme ukládá, že každý jedinec patří do určité populace (Z) a vezme nebo ne léky (X).

na druhou stranu, pokud chceme jen průměrný účinek napříč celou populací, pak musíme podmínku jen na léčbu (X). V tomto případě chceme vypočítat P (Y=1 / X=1) – P (Y=1 / X=0). Tento výraz přepíšeme jako:

Where we can easily plugin the expressions defined above.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.