eitere Details zur späteren Bewertung und Anpassung von Kausalmodellen, aber selbst dieses einfache Spielzeugmodell gibt uns bereits einen Vorgeschmack auf das, was kommen wird, und die Einfachheit (und Allgemeinheit) dieses Ansatzes.
Ein stochastisches Beispiel
Schauen wir uns nun ein komplexeres Beispiel an, SCM 1.5.3. In diesem Fall ist der SCM gegeben durch:
SCM 1.5.3
From this specification, we can easily obtain the corresponding DAG:
Graphical Model for SCM 1.5.3
We are also told that all exogenous variables are independently distributed with an expected value zero. Dies impliziert, dass die exogenen Variablen unbeobachteten Einflüssen in unserem Modell entsprechen und daher als Fehlerfaktoren behandelt werden können.
Wenn wir normalverteilte Zufallswerte für Ux, Uy und Uz einstecken, können wir schnell einen Datenrahmen erstellen, der die Werte von X, Y und Z spezifiziert.
Vergessen wir für eine Sekunde, dass wir die expliziten analytischen Formeln haben, die die Werte unserer endogenen Variablen erzeugen und nur die numerischen Werte in unserem Datenrahmen verwenden.
Alle Fragen, die wir zum Verhalten dieses Modells haben könnten, können mit einem ähnlichen Verfahren wie dem oben verwendeten beantwortet werden: anpassen eines linearen Modells (da wir davon ausgehen, dass alle Abhängigkeiten linear sind), bei dem unsere beobachteten Werte die unabhängigen Variablen und unsere Unbekannten die abhängigen Variablen sind.Zum Beispiel, wenn wir wissen wollen, was der Wert von Z für einen bestimmten Wert von Y sein könnte, würden wir einfach Z ~ Y passen und dann den entsprechenden Wert von Y. Wenn Y=3 , dann ist der erwartete Wert von Z 0,189261, wie leicht überprüft werden kann, indem man Y = 3 in den obigen Ausdruck für fZ einfügt (wo wir schnell sehen, dass Z= 3/16).
Was wäre andererseits der Wert von Z, wenn wir zusätzlich zur Beobachtung von Y=3 auch beobachten, dass X=1 ? Wenn wir diese Anpassung durchführen, erhalten wir:
Wo wir einfach die Koeffizienten für Y und X ablesen können. Wenn wir nun die Werte von X und Y einstecken, erhalten wir Z=0,189821, was dem oben erhaltenen Wert ähnlich ist.
Wir hätten vermuten können, dass dies das Ergebnis sein würde, wenn wir uns die Übersichtstabelle oben angesehen hätten. Wir wissen, dass der Koeffizient für X 0,0053 ± 0,003 ist, was ihn sehr nahe an Null macht, praktisch vernachlässigbar.
Dies mag zwar überraschend erscheinen, ist aber einer der Hauptgründe, warum diese Modellklasse so leistungsstark ist.
Der Wert einer bestimmten endogenen Variablen kann nur von den Werten ihrer Eltern abhängen
Diese einfache Beobachtung bedeutet, dass wir unsere Berechnungen erheblich vereinfachen können, indem wir alle Variablen ignorieren, die nicht zu den Eltern der Variablen gehören, an der wir interessiert sind.
Was uns zu unserem nächsten Thema führt…
1.5.2 Produktzerlegung
Wir können auf unserer obigen Beobachtung aufbauen, um eine einfache, aber mächtige Regel zu definieren, die „Regel der Produktzerlegung“, die im Buch als:
Für jedes Modell, dessen Graph azyklisch ist, ist die gemeinsame Verteilung der Variablen im Modell durch das Produkt der bedingten Verteilungen P(Kind |Eltern) über alle „Familien“ im Graph gegeben
Also für einen einfachen Kettengraphen:
Wir können sofort schreiben:
Dies bedeutet, dass anstelle von eine große Beobachtungstabelle für jede mögliche Kombination von X, Y und X Wir brauchen nur viel kleinere Tabellen für X, Y | X und Z | Y, die die gleichen Informationen enthalten und viel einfacher zu erhalten sind.Noch wichtiger ist, dass grafische Modelle es uns ermöglichen, diese Zerlegung aufzuschreiben, ohne explizit etwas über die Funktionen zu wissen, die jeder Variablen zugrunde liegen.
In general, we write:
Let us now consider the example in Fig 1.10:
DAG from Fig 1.10 with the associated probability tables.
From this figure, we can immediately write:
and:
Which could also be obtained from the definition of the conditional probability P(X|Z). We can further write:
by the theorem of total probability. And if we plugin the values from the conditional probability tables above, we obtain:
And, similarly:
die Auswirkung der Einnahme des Arzneimittels auf die Mortalität (Y=1) (X=1) durch Berechnung der Differenz P(Y=1|X= 1) -P(Y=1|X= 0). Für die Population mit (Z = 1) und ohne (Z = 0) der Krankheit haben wir:
Hier sollte klar sein, warum wir konditionieren sowohl X als auch Z: Wir imponieren, dass jedes Individuum zu einer bestimmten Population gehört (Z) und die Medikamente einnimmt oder nicht (X).Auf der anderen Seite, wenn wir nur durchschnittliche Wirkung über die gesamte Bevölkerung wollen, dann müssen wir nur auf die Behandlung (X) konditionieren. In diesem Fall möchten wir P(Y= 1 | X= 1) -P(Y= 1 | X= 0) berechnen. Wir schreiben diesen Ausdruck um als:
Where we can easily plugin the expressions defined above.