La inferencia causal implica..
Kausale Inferenz beinhaltet…
• Kausale Inferenz beinhaltet…
• mehr als (beobachtete) Zusammenhänge zwischen Variablen
• die Vorhersage der Folge von Interventionen („Was passiert, falls ich das mache?“)
• die Imputation von fehlenden Beobachtungen („Was wäre passiert, wenn ich etwas anderes gemacht hätte?“)
Was ist Kausalität?
Directed Acyclic Graphs (DAGs)
que son DAGs?
DAG als graphische Darstellung einer (abstrakten) Kausaltheorie:
Ein gerichteter (d.h., einseitiger) Pfeil von einer Variable X auf eine Variable Y bedeutet:
Jeder Pfeil der nicht eingezeichnet ist,…
Womit kann man wissen, ob bestimmte Arten von kausalen Aussagen prinzipiell untersuchbar sind?
Un marco cada vez más popular para formalizar cuestiones causales en la ciencia empírica son los denominados «grafos acíclicos dirigidos» (DAG, por sus siglas en inglés).
DAG como representación gráfica de una teoría causal (abstracta):
• Una flecha dirigida (es decir, unidireccional) de una variable X a una variable Y significa: X tiene un efecto causal (directo) sobre Y (y no al revés).
• Cada flecha que no está dibujada formaliza la suposición de que no existe el efecto causal (directo) correspondiente.
• Existe un marco matemático («Do-Calculus») con el que se puede demostrar formalmente, solo con ayuda de las suposiciones causales contenidas en un DAG, si determinados tipos de afirmaciones causales son en principio investigables, en caso de que el DAG supuesto sea correcto (es decir, que las suposiciones causales formalizadas en él sean ciertas).
DAGs treffen (zunächst) keine Annahmen über …
Die aus der Analyse von DAGs resultierenden Aussagen sind gleichzeitig:
Was ist nutzlich, um die aus DAGs ableitbaren Gesetzmäßigkeiten veranschaulichen zu können, ohne sich mit der Mathematik beschäftigen zu müssen?
Vorteile davon?
Para poder ilustrar las regularidades que se pueden deducir de los DAG sin tener que ocuparse de las matemáticas, resulta útil simular datos en los que el proceso de generación de datos se corresponde con la estructura causal formalizada en el DAG. Para ello, solemos partir de supuestos simplificados adicionales (distribución normal o bernoulliana de las variables, relaciones lineales, ausencia de interacciones).
• Ventajas de las simulaciones de datos:
se conoce la verdad (si existe un efecto causal, de qué tipo es, cuál es su magnitud, etc.) y, por lo tanto, se sabe cuál debe ser el resultado cuando se intenta estimar el efecto causal con métodos estadísticos basados en los datos disponibles
(por ejemplo, con regresión lineal múltiple).
Schlau Daten simulieren Was sind diese Syntaxen?
Aus welchen charakteristischen Kausalstrukturen bestehen alle DAGs?
Was fragen wir uns immer dabei?
Was ist einer der größten Vorteile davon, sich das angedachte kausale Modell als DAG aufzuzeichnen?
Wie mussen die Daten immer simuliert werden?
Welche andere Namen hat the fork?
Sind X und Y unabhängig?
Was passierte, wenn Z kontrolliert wurde?
Was wäre dann Z?
Wie heißt dieses Phänomen?
Wie Break man the Fork?
comon cause/ confounder
Was ist die schwarze Linie?
Was bedeuten die blaue und rote Linien?
Statistisch gesehen, was bedeutet die Kontrolle von Drittvariablen?
Was ergibt diese Analyse?
Welche andere Namen hat the pipe?
Was schätzt die einfache Regression und was die Multiple?
Chain/Mediation
Was ist bedeutet die schwarze Linie?
Welche andere Namen hat the collider?
Was ist “collider bias”?
Was ist Good control, und was bad control?
Fragestellung: Führt Glaubwürdigkeit in der Forschung zu langweiligeren Publikationen?
Annahme: Es zeigt sich empirisch eine negative Korrelation zwischen „trustworthiness“ und „newsworthiness“.
Wie kontrolliert man hier?
Pregunta: ¿La credibilidad en la investigación conduce a publicaciones más aburridas?
Hipótesis: Se observa empíricamente una correlación negativa entre «fiabilidad» y «interés periodístico».
• Se puede publicar si la investigación es interesante y/o está bien hecha. Si solo se tiene en cuenta la literatura publicada, se produce un colisionador («efecto de distorsión de selección»), lo que genera una correlación aparente.
• Nota: aquí no se controla el colisionador en el modelo estadístico, sino que se controla implícitamente en el marco del muestreo selectivo o la recopilación de datos para ello.
• Personalauswahl: (kein) Psychopath (X, negativ) und Genialität (Y, positiv)
• Einschlusskriterium bei klinischer Studie: Man muss entweder eine schwere Depression (X) oder eine schwere Angststörung (Y) haben.
Welche scheinbare) Komorbidität findet man in seiner Stichprobe?
La misma estructura se encuentra siempre que se tiene un modelo de selección compensatorio (enlace OR; es decir, se accede a la selección por diferentes vías).
• Selección de personal: (no) psicópata (X, negativo) y genialidad (Y, positivo)
• Criterio de inclusión en un estudio clínico: se debe padecer depresión grave (X) o un trastorno de ansiedad grave (Y). ¿Qué comorbilidad (aparente) se encuentra en la muestra?
• Prueba de acceso BAPsy: quienes obtienen buenas notas en el bachillerato obtienen peores resultados en la prueba BAPsy (entre los estudiantes admitidos).
Angenommen man geht von dem folgenden DAG aus und interessiert sich für den kausalen Effekt von X auf Y.
Wie lässt sich ein randomisiertes Experiment als DAG darstellen und wieso?
En psicología, una interpretación causal de un efecto de X sobre Y solo se acepta a menudo si la variable X se ha aleatorizado de forma aleatoria en un experimento (por ejemplo, ECA en psicología clínica, prueba A/B en psicología publicitaria). ¿Cómo se puede representar un experimento aleatorizado como un DAG?
• Supongamos que partimos del siguiente DAG y nos interesa el efecto causal de X sobre Y. Una aleatorización real de X (en el marco de un experimento) da lugar a que se puedan eliminar todas las flechas sobre X, ya que la variable aleatorizada, por diseño, ya no puede verse influida por las demás variables.
Was ist ein Backdoor Kriterium und was erlaubt?
Was muss als erstes gemacht werden?
Welche Pfaden sind Backdoor Pfade?
Wann ist ein Pfad geschlossen bzw. offen?
Welche Pfaden hier sind offen bzw. geschlossen?
Wie schließt man jede der offenen Pfaden hier?
Wir interessieren uns für den totalen kausalen Effekt von X auf Y.
Wir nehmen an, dass die Variable U nicht beobachtet wurde
(d.h. nicht möglich ist, als Kontrollvariable ins Model aufzunehmen)
• Frage: Ist Z jeweils eine „gute“ oder eine „schlechte“ Kontrollvariable?
Ojo: O sea que las Us no las puedes controlar
Wie bestimmt man, ob ein DAG zutreffend ist?
Was passiert, wenn der DAG eine falsche Repräsentation der Realität ist?
Was sollte eine gute Theorie ermöglichen?
Die Annamen über Zusammenhänge zwischen Variablen und ihre Rollen im Modell verschwinden, wenn man diese nicht offenlegt. Richtig oder Falsch?
Ablauf zur Untersuchung kausaler Effekte:
5 Schritte und eine Folge
Procedimiento para el análisis de los efectos causales:
Elaboración de un modelo causal a partir de la teoría en forma de DAG, teniendo en cuenta todas las variables relevantes posibles
Determinación del efecto causal concreto que interesa.
Determinación, basándose en las reglas de la inferencia causal, de si el efecto de interés puede investigarse en principio con la información disponible y qué variables deben controlarse para ello.
Formulación de supuestos adicionales que describan funcionalmente las variables y sus relaciones (por ejemplo, la no linealidad).
Determinación de un modelo estadístico (normalmente un modelo de regresión) que pueda estimar de forma significativa el efecto de interés, si el DAG y las hipótesis adicionales son correctas.
Consecuencia de este procedimiento:
• Con el mismo DAG, a menudo se necesitan diferentes modelos de regresión, dependiendo del efecto causal que nos interese.
Was sind Strukturgleichungsmodelle?
Enfoque metodológico alternativo en el que no se especifica un modelo de regresión propio para cada efecto causal:
Creación de un modelo causal a partir de la teoría en forma de DAG, teniendo en cuenta todas las variables relevantes en la medida de lo posible.
Establecimiento de supuestos adicionales que describan funcionalmente las variables y sus relaciones.
Creación de un modelo estadístico que represente todas las hipótesis causales y funcionales a la vez.
Consecuencias de este procedimiento:
Un único modelo estadístico que representa todas las relaciones causales y que, por lo tanto, puede utilizarse para investigar diferentes cuestiones causales.
Un método para especificar dicho modelo son los modelos de ecuaciones estructurales lineales (SEM, por sus siglas en inglés).
Ein Lineares Strukturgleichungsmodell (SEM) kann betrachtet werden als die Kombination…
3 punkte
Welche Rolle spielen latente Variablen?
Zuletzt geändertvor 5 Tagen