strukturális oksági modellek

1.5.1 okozati feltételezések modellezése

az előző bejegyzésben irányított aciklikus grafikonokkal foglalkoztunk. Ebben a részben megtanuljuk, hogyan használhatjuk a Dag-okat a modelljeink ok-okozati feltételezéseinek indoklására.

matematikailag a strukturális oksági modell (SCM) endogén (V) és exogén (U) változók halmazából áll, amelyeket egy függvénykészlet (F) köt össze, amelyek meghatározzák a a változók V-ben az U-ban lévő változók értékei alapján.

intuitív módon, ha egy DAG-ra úgy gondolunk, mint amely információáramlást képvisel, akkor az U változók a rendszer bemenetei, míg a v változók azok a csomópontok, ahol az információ feldolgozásra kerül.

minden SCM egy grafikus modellhez (dag) van társítva, ahol minden csomópont egy változó U vagy V-ben, és minden él egy függvény f. Minden él (függvény) egy okozati feltételezésnek felel meg:

  • ha az Y változó egy X változó gyermeke, akkor azt mondjuk, hogy Y okozza X, vagy hogy X az Y közvetlen oka.
  • Ha az Y változó egy X változó leszármazottja, akkor azt mondjuk, hogy y potenciálisan x okozta, vagy hogy X az Y lehetséges oka.

nézzük meg az 1.9. ábra példáját:

1.9. ábra — az SCM 1.5.1 grafikus modellje

ha egyszerűen megnézzük ezt a grafikont, azonnal és intuitív módon megragadjuk a mögöttes SCM:

  • X-nek és Y-nak nincsenek bejövő élei, tehát exogén változók (U-hoz tartoznak).
  • Z-nek két bejövő éle van, tehát endogén változó (a V-hez tartozik).
  • Z-nek két közvetlen oka van X és Y, vagy más szavakkal, Z értéke kifejezetten az X és Y értékeitől függ, és fz=f(X, Y).

szükségünk van azonban az SCM teljes specifikációjára, hogy pontosan tudjuk, mi az FZ függvény, amely meghatározza a Z. a strukturális oksági modell csak akkor van teljesen meghatározva, ha a fenti DAG mellett megadjuk:

SCM 1.5.1

itt fontos megjegyezni, hogy bár a dag-k kevesebb információt tartalmaznak, mint a teljesen megadott SCM, gyakran hasznosabbak. A Grafikonok rendkívül vizuális objektumok, így könnyebben értelmezhetők és elemezhetők. Gyakran előfordul, hogy egyszerűen nincs elegendő információnk az SCM teljes meghatározásához, de intuitív módon meghatározhatjuk, hogy néz ki az oksági grafikon.

modellek szimulálása

a teljesen meghatározott SCM egyik előnye, hogy meglehetősen könnyen szimulálhatók. Például létrehozhatunk néhány hamis (determinisztikus) adatot a fent leírt SCM-hez:

amely egy egyszerű pandas Adatkeretet generál X, Y és Z értékekkel:

megbocsátok, ha nem lenyűgözött ez a példa. Végül, az egyetlen dolog, amit tettünk, hamis adatokat generáltunk egy egyszerű egyenlet alapján. Ez nem különösebben lenyűgöző, amíg egy kicsit a felszín alá nem nézünk:

Ez az adatkeret a modellünk teljesen numerikus leírását képviseli… más szóval, ez egy játékverzió annak, amit az eredeti adatok, amelyeket a fenti DAG-val együtt használhattak volna, hogy illeszkedjenek a funkcióhoz fz.

Ha ezt az Adatkeretet “empirikus adataink” – ként kezeljük, és feltételezzük (bizonyos tartományi ismeretek alapján), hogy az fz-nek X és Y lineáris regressziójának kell lennie, akkor egyszerűen beilleszthetjük a Z ~ X + Y-t:

vissza, mint az együtthatók szorozva X és y, ill:

sokkal részletesebben megvizsgáljuk, hogyan lehet később értékelni és illeszteni az oksági modelleket, de még ez az egyszerű játékmodell is ízelítőt ad nekünk a jövőről és ennek a megközelítésnek az egyszerűségéről (és általánosságáról).

sztochasztikus példa

vessünk egy pillantást egy összetettebb példára, az SCM 1.5.3-ra. Ebben az esetben az SCM-et a következők adják meg:

SCM 1.5.3

From this specification, we can easily obtain the corresponding DAG:

Graphical Model for SCM 1.5.3

We are also told that all exogenous variables are independently distributed with an expected value zero. Ez azt jelenti, hogy az exogén változók modellünkben nem megfigyelt hatásoknak felelnek meg, ezért hibatényezőként kezelhetők.

az UX, Uy és Uz normál eloszlású véletlenszerű értékeinek csatlakoztatásával gyorsan felépíthetünk egy Adatkeretet, amely meghatározza az X, Y és Z értékeket.

felejtsük el egy pillanatra, hogy rendelkezünk az explicit analitikai képletekkel, amelyek az endogén változók értékeit állítják elő, és csak a numerikus értékeket használják az Adatkeretben.

a modell viselkedésével kapcsolatos bármilyen kérdésre a fentiekhez hasonló eljárással lehet válaszolni: lineáris modell illesztése (mivel feltételezzük, hogy minden függőség lineáris), ahol a megfigyelt értékeink a független változók, az ismeretlenjeink pedig a függő változók.

például, ha meg akarjuk tudni, hogy mi lehet A Z értéke egy adott y értékre, akkor egyszerűen beillesztjük Z ~ Y majd beépíti a megfelelő értéket Y. Ha Y=3, akkor a várható értéke Z 0,189261, amint az könnyen ellenőrizhető az Y=3 csatlakoztatásával a fenti FZ kifejezésben (ahol gyorsan látjuk, hogy Z=3/16).

másrészt mi lenne a Z értéke, ha az Y=3 megfigyelés mellett azt is megfigyeljük, hogy X=1? A válasz erre a kérdésre is illik Z~X+Y. amikor végre ezt az illeszkedést, megkapjuk:

ahol csak leolvashatjuk az Y és x együtthatóit.

sejthettük volna, hogy ez lesz az eredmény, ha megnézzük a fenti összefoglaló táblázatot. Azt vetjük be, hogy az X együtthatója 0,0053 0,003, így nagyon közel van a nullához, gyakorlatilag elhanyagolható.

bár ez meglepőnek tűnhet, ez az egyik fő oka annak, hogy ez a modellosztály olyan erős.

egy adott endogén változó értéke csak a szülei értékétől függhet

Ez az egyszerű megfigyelés azt jelenti, hogy jelentősen leegyszerűsíthetjük számításainkat azáltal, hogy figyelmen kívül hagyunk minden olyan változót, amely nem tartozik az érdeklődők szülei közé.

ami elvezet minket a következő témához…

1.5.2 Termékbontás

a fenti megfigyelésünkre felépíthetünk egy egyszerű, mégis erőteljes szabályt, a “Termékbontás szabályát”, amelyet a könyv a következőképpen határoz meg:

minden olyan modell esetében, amelynek gráfja aciklusos, a modellben szereplő változók közös eloszlását a feltételes eloszlások szorzata adja meg P(gyermek|szülők) a gráf összes “családjára”

tehát egy egyszerű láncgráf esetében:

azonnal írhatunk:

Ez azt jelenti, hogy az X, Y és X lehetséges kombinációira vonatkozó nagy megfigyelési táblázat helyett sokkal kisebb táblázatokra van szükségünk X, Y / X és z / y számára, amelyek ugyanazokat az információkat tartalmazzák, és sokkal könnyebben beszerezhetők.

ennél is fontosabb, hogy a grafikus modellek lehetővé teszik számunkra, hogy leírjuk ezt a bomlást anélkül, hogy kifejezetten tudnánk valamit az egyes változók alapjául szolgáló funkciókról.

In general, we write:

Let us now consider the example in Fig 1.10:

DAG from Fig 1.10 with the associated probability tables.

From this figure, we can immediately write:

and:

Which could also be obtained from the definition of the conditional probability P(X|Z). We can further write:

by the theorem of total probability. And if we plugin the values from the conditional probability tables above, we obtain:

And, similarly:

végül a p (y=1 / x=1)-p (y=1 / x=0) különbség kiszámításával megbecsülhetjük a gyógyszer szedésének mortalitásra(y=1) gyakorolt hatását. A betegség (Z=1) és (Z=0) nélküli populáció esetében:

itt egyértelműnek kell lennie, hogy miért kondicionáljuk mind az X-et, mind a Z-t: arra kényszerítjük, hogy minden egyén egy adott populációhoz (z) tartozzon, és vegye be vagy sem a gyógyszert (x).

másrészt, ha csak átlagos hatást akarunk elérni az egész populációban, akkor csak a kezelést kell feltételezni (X). Ebben az esetben ki akarjuk számítani P(Y=1|X=1)-P(Y=1|X=0). Ezt a kifejezést úgy írjuk át, mint:

Where we can easily plugin the expressions defined above.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.