sokkal részletesebben megvizsgáljuk, hogyan lehet később értékelni és illeszteni az oksági modelleket, de még ez az egyszerű játékmodell is ízelítőt ad nekünk a jövőről és ennek a megközelítésnek az egyszerűségéről (és általánosságáról).
sztochasztikus példa
vessünk egy pillantást egy összetettebb példára, az SCM 1.5.3-ra. Ebben az esetben az SCM-et a következők adják meg:
SCM 1.5.3
From this specification, we can easily obtain the corresponding DAG:
Graphical Model for SCM 1.5.3
We are also told that all exogenous variables are independently distributed with an expected value zero. Ez azt jelenti, hogy az exogén változók modellünkben nem megfigyelt hatásoknak felelnek meg, ezért hibatényezőként kezelhetők.
az UX, Uy és Uz normál eloszlású véletlenszerű értékeinek csatlakoztatásával gyorsan felépíthetünk egy Adatkeretet, amely meghatározza az X, Y és Z értékeket.
felejtsük el egy pillanatra, hogy rendelkezünk az explicit analitikai képletekkel, amelyek az endogén változók értékeit állítják elő, és csak a numerikus értékeket használják az Adatkeretben.
a modell viselkedésével kapcsolatos bármilyen kérdésre a fentiekhez hasonló eljárással lehet válaszolni: lineáris modell illesztése (mivel feltételezzük, hogy minden függőség lineáris), ahol a megfigyelt értékeink a független változók, az ismeretlenjeink pedig a függő változók.
például, ha meg akarjuk tudni, hogy mi lehet A Z értéke egy adott y értékre, akkor egyszerűen beillesztjük Z ~ Y majd beépíti a megfelelő értéket Y. Ha Y=3, akkor a várható értéke Z 0,189261, amint az könnyen ellenőrizhető az Y=3 csatlakoztatásával a fenti FZ kifejezésben (ahol gyorsan látjuk, hogy Z=3/16).
másrészt mi lenne a Z értéke, ha az Y=3 megfigyelés mellett azt is megfigyeljük, hogy X=1? A válasz erre a kérdésre is illik Z~X+Y. amikor végre ezt az illeszkedést, megkapjuk:
ahol csak leolvashatjuk az Y és x együtthatóit.
sejthettük volna, hogy ez lesz az eredmény, ha megnézzük a fenti összefoglaló táblázatot. Azt vetjük be, hogy az X együtthatója 0,0053 0,003, így nagyon közel van a nullához, gyakorlatilag elhanyagolható.
bár ez meglepőnek tűnhet, ez az egyik fő oka annak, hogy ez a modellosztály olyan erős.
egy adott endogén változó értéke csak a szülei értékétől függhet
Ez az egyszerű megfigyelés azt jelenti, hogy jelentősen leegyszerűsíthetjük számításainkat azáltal, hogy figyelmen kívül hagyunk minden olyan változót, amely nem tartozik az érdeklődők szülei közé.
ami elvezet minket a következő témához…
1.5.2 Termékbontás
a fenti megfigyelésünkre felépíthetünk egy egyszerű, mégis erőteljes szabályt, a “Termékbontás szabályát”, amelyet a könyv a következőképpen határoz meg:
minden olyan modell esetében, amelynek gráfja aciklusos, a modellben szereplő változók közös eloszlását a feltételes eloszlások szorzata adja meg P(gyermek|szülők) a gráf összes “családjára”
tehát egy egyszerű láncgráf esetében:
azonnal írhatunk:
Ez azt jelenti, hogy az X, Y és X lehetséges kombinációira vonatkozó nagy megfigyelési táblázat helyett sokkal kisebb táblázatokra van szükségünk X, Y / X és z / y számára, amelyek ugyanazokat az információkat tartalmazzák, és sokkal könnyebben beszerezhetők.
ennél is fontosabb, hogy a grafikus modellek lehetővé teszik számunkra, hogy leírjuk ezt a bomlást anélkül, hogy kifejezetten tudnánk valamit az egyes változók alapjául szolgáló funkciókról.
In general, we write:
Let us now consider the example in Fig 1.10:
DAG from Fig 1.10 with the associated probability tables.
From this figure, we can immediately write:
and:
Which could also be obtained from the definition of the conditional probability P(X|Z). We can further write:
by the theorem of total probability. And if we plugin the values from the conditional probability tables above, we obtain:
And, similarly:
végül a p (y=1 / x=1)-p (y=1 / x=0) különbség kiszámításával megbecsülhetjük a gyógyszer szedésének mortalitásra(y=1) gyakorolt hatását. A betegség (Z=1) és (Z=0) nélküli populáció esetében:
itt egyértelműnek kell lennie, hogy miért kondicionáljuk mind az X-et, mind a Z-t: arra kényszerítjük, hogy minden egyén egy adott populációhoz (z) tartozzon, és vegye be vagy sem a gyógyszert (x).
másrészt, ha csak átlagos hatást akarunk elérni az egész populációban, akkor csak a kezelést kell feltételezni (X). Ebben az esetben ki akarjuk számítani P(Y=1|X=1)-P(Y=1|X=0). Ezt a kifejezést úgy írjuk át, mint:
Where we can easily plugin the expressions defined above.