Was ist ein Multigruppen-SEM?
Ziel?
Welche Frage beantwortet dies?
Gruppenunterschiede festgestellt… was dann?
Was wird erwartet, Wenn Messinvarianz nicht vorliegt?
Was bedeutet Messinvarianz?
• En un SEM multigrupo, se considera un modelo específico simultáneamente para diferentes grupos de personas (por ejemplo, datos de dos países).
Aquí se consideran principalmente los modelos de medición de un SEM.
• Uno de los objetivos de los SEM multigrupo es averiguar si existe invarianza de medición entre los grupos.
• Pregunta central al examinar la invarianza de medición:
¿Son equivalentes los modelos de medición entre los grupos? (En otras palabras: ¿son iguales los parámetros de los modelos de medición, es decir, por ejemplo, las cargas, entre los grupos?)
• Si se detectan diferencias entre los grupos (por ejemplo, las personas en EE. UU. son más extrovertidas que las personas en Alemania), la existencia de invarianza de medición determina si las diferencias observadas entre los grupos pueden interpretarse como diferencias «reales» entre los grupos o si los constructos en los grupos solo se miden de manera diferente.
Si no hay invariancia de medición, se espera un resultado diferente en la prueba dependiendo de la pertenencia a un grupo, aunque la característica real y «verdadera» del constructo sea la misma (entonces estamos comparando «manzanas con naranjas»).
• A menudo se lee que la invarianza de la medición significa que se mide el mismo constructo en los grupos. Esto no es del todo cierto. Lo que se mide en los respectivos grupos es una cuestión de validez.
• La invarianza de la medición significa, en primer lugar, que los parámetros de los modelos de medición son iguales/invariantes en ambos grupos.
La invarianza de medición se da cuando un conjunto de ítems (variables manifiestas) registra el mismo constructo en diferentes poblaciones y/o en diferentes condiciones (por ejemplo, momentos de medición). La invarianza de medición es necesaria para poder interpretar las diferencias entre grupos o los cambios en los valores característicos de la distribución (por ejemplo, medias, varianzas) o los valores individuales como diferencias entre grupos en las características del constructo o como cambios en las características del constructo.
Messinvarianz ist gegeben, wenn ein Set von Items (manifeste Variablen) in verschiedenen Populationen und/oder unter verschiedenen Bedingungen (z.B. Messzeitpunkte) dasselbe Konstrukt erfasst. Messinvarianz ist notwendig, um Gruppenunterschiede bzw. Veränderungen in den Verteilungskennwerten (z.B. Mittelwerten, Varianzen) oder individuelle Werten als Gruppenunterschiede in Konstruktausprägungen bzw. als Veränderungen in Konstruktausprägungen interpretieren zu können.
La invariancia de medición puede verse afectada por muchos factores, por ejemplo
• Efectos de la edad: «Me gusta ir a fiestas» puede ser un buen ítem de extraversión para personas de entre 20 y 40 años. En personas de 70 años, la «conexión» con el constructo de extraversión probablemente sea menos fuerte (véase Seifert, Rohrer y Schmuckle, 2024).
• Efectos de género: la depresión se manifiesta de forma diferente en hombres y mujeres (por ejemplo, síntomas externalizantes frente a internalizantes). «Lloro mucho» podría ser un «marcador» de depresión con diferente intensidad según el género.
• Efectos culturales: las escalas de respuesta (por ejemplo, escalas de Likert, «no estoy de acuerdo» a «estoy de acuerdo») se utilizan a menudo de manera diferente entre los grupos, por ejemplo, diferencias culturales en las tendencias de acuerdo (véase Lechner, Partsch, Dammer y Rammstedt, 2019).
Nos gustaría tener una varianza de medición y demostrar que se mide lo mismo en los subgrupos.
Ejemplo: 5 preguntas de tests de inteligencia para mujeres y hombres.
Si estos 5 ítems se relacionan con el constructo latente de manera diferente para los hombres que para las mujeres,
el constructo latente es diferente.
Sobre la base de estos ítems, no se puede investigar si los hombres y las mujeres difieren en su inteligencia media
.
5 Schritte
SEM multigrupo o CFA (analisis confirmatorio de factores) multigrupo:
1. La muestra se divide en (por ejemplo, 2) grupos (por ejemplo, datos de dos países).
2. En cada grupo, el CFA se estima primero por separado, pero hay una estadística de ajuste común (respectivamente) para todos los grupos.
3. «Restricciones de igualdad de grupos»: se vuelve a estimar un modelo de este tipo, pero esta vez con el requisito de que determinados parámetros deben ser iguales entre los grupos (Configuracion/metrica/escala).
4. Comparación de modelos con la prueba de diferencia χ²: ¿el ajuste del modelo (en todos los grupos) empeora significativamente cuando se introducen restricciones entre los grupos?
—> Indicio de falta de invarianza, es decir, de que los parámetros de los modelos de medida son diferentes entre los grupos
5. Dado que la prueba de diferencia χ² no tiene en cuenta la fuerza de la invarianza y, al mismo tiempo, tiene un alto Power en muestras grandes, se recomienda tener en cuenta también las diferencias en los índices de ajuste (especialmente RMSEA y CFI) al probar la invarianza de la medición.
Messinvarianz Gleichung
Welche 3 Arten gibt es?
Worin besteht jede?
Welche muss man auswählen, wenn man die Gruppen in ihrer durchschnittlichen Ausprägung auf den latenten Konstrukten vergleichen will?
Ecuación definitoria utilizando el ejemplo de un ítem:
X1 = τ1+λ1ξ + ε1 (en el metrico en vez de λ1ξ, habria un 1. En el escalar tambien τ1 seria solo un 1)
1. «Configural invariance»: dos grupos (por ejemplo, datos de dos países diferentes), ambos reciben el mismo modelo estructural, pero se ajustan por separado
2. «Weak/metric invariance»: las cargas (λ) se igualan entre los grupos.
—> En caso de invariancia (diferencias no significativas en los niveles de carga entre los grupos), muestra que los constructos latentes tienen el mismo significado en ambos grupos (o que el tamaño de la muestra no es lo suficientemente grande como para detectar diferencias entre los grupos).
Zeigt bei Invarianz, (nicht signi unterschiedliche Ladungshöhen zw Gruppen) dass latente Konstrukte in beiden Gruppen die gleiche Bedeutung haben (bzw. dass die Stichprobengroße nicht groß genug ist, um Unterschiede zw den Gruppen festzustellen
3. «Invarianza fuerte/escalar»: (además de las cargas factoriales) las intersecciones (τ) de los ítems se
igualan.
—> Zeigt bei Invarianz, dass las latente Konstrukt in beiden Gruppen die gleiche Bedeutung hat und, dass die durchschnittliche Werte dieses latenten Konstrukts gleich sind (wenn alle andere F auf 0 gesetzt sind, creo)
Importante: si se desea comparar grupos en su durchschnittlichen Ausprägung en los constructos latentes, ¡debe darse la invarianza 3 fuerte/escalar!
Nota: Existen otros tipos de invariancia, por ejemplo, en relación con las varianzas de ε (Structural Invarianz —> En caso de invariancia, muestra que no se han podido detectar diferencias en la fuerza de las rutas causales y/o las varianzas de los factores latentes.
—> Zeigt bei Invarianz, dass keine Unterschiede in der Stärke der kausalen Pfade und/oder Varianzen der latenten Faktoren festgestellt werden konnte)
—> En sentido estricto, esto se aplica a todos los tipos de comparaciones (por ejemplo, grupo de terapia frente a grupo de control, o incluso comparaciones dentro de grupos a lo largo del tiempo).
Invarianz
Welche Frage könnte man hier gefragt haben?
fit = modelo configural
Diferencias intergrupales en messmodelle.
R Argument group =
fit <- cfa(model = HS.model,
data = HolzingerSwineford1939, group = "school")
summary(fit, standardized = TRUE, fit.measures = TRUE)
Qué es este Output?
De donde se reconoce?
Interpretalo
Output de Configural invariance:
Para diferencias INTERGRUPALES en Messmodelle
En R se reconoce por el Argumento group = „school“ en este caso
Aqui vemos descriptivamente que las ladungen de x2 en „escuela“ 1 (arriba) y escuela 2 (abajo) son diferentes.
las de arriba son mas debiles que las de abajo (con fix de x1) tambien las z standarisierte std.all.
Este Output es nur un confirmatorische Factor Analyse separado para cada grupo
fit2 <- cfa(HS.model, data = HolzingerSwineford1939,
group = "school", group.equal = c("loadings"))
Welches ist das configural Modell und welches metric?
Was ist diesen Output?
Interpretation des Beispiels
Wie würde das R Syntax aussehen, wenn wir nun noch die Invarianz der Intercepts testen (scalar model) und mit dem metric model vergleichen?
Interpretación del ejemplo:
El modelo con los mismos parámetros de carga (modelo métrico/restricción de carga) para los diferentes grupos no es peor que el modelo con estimación libre de parámetros
(modelo configuracional):
—>se ha determinado la «invarianza métrica»; las cargas pueden considerarse invariantes/iguales entre los grupos.
Output es un Modellvergleich entre configural y metrische Modelle
En modelo fit2 hay 6 df extra, y la diferencia en χ ² es de 8.19, INsignificante pr(>chisq) 0.2244
R Syntax für scalar Modell vs metric Modell:
fit3 <- cfa(HS.model, data = HolzingerSwineford1939,
group = "school", group.equal = c("loadings, intercepts"))
Qué te dice este DAG en cuanto a X und Y?
y en cuanto a Z?
Cuáles serian las 4 Hipótesis (inhaltlich)?
Hipotesis
Strukturmodell: Inhaltlich geht man hier davon aus, dass es ein Mediationseffekt gibt, da TL—>PO 0.35, y PO—>OCB 0.50. Son ZH mas fuertes que el de TL—>OCB de 0.12. Si este ZH nicht mehr signifikant ist, dann gibt es eine Mediation completa
Y asi fue en el Output de los datos.
Welche DAG Struktur ist die fundamentale Kausalstruktur im Rahmen von Mediationsanalysen?
Worum geht es inhaltlich in Mediationsanalysen?
Worum geht es im Rahmen der kausalen Inferenz in Mediationsanalysen im Grunde?
• El Pipe es la estructura causal fundamental en el marco de los análisis de mediación.
• En los análisis de mediación, se trata (inhaltlich) de cómo una variable X (tratamiento) afecta causalmente a una variable Y (resultado) a través de una o varias otras variables M (mediador).
• En el marco de la inferencia causal, los análisis de mediación se centran básicamente en la observación (y la comparación) de los efectos causales totales, directos e indirectos.
• En primer lugar, analizaremos el fenómeno de la mediación en general con ayuda de DAG.
• despues examinaremos la estimación de los efectos causales totales, directos e indirectos en el caso sencillo de los SEM lineales.
Totaler kausaler Effekt von X auf Y:
Was beinhaltet der Totale Effekt? Wie ist dies im DAG?
Wie bestimme ich für welche Variablen bei der Schätzung des totalen Effekts von X auf Y kontrolliert werden muss?
Efecto causal total de X sobre Y: cambio esperado en Y cuando se manipula X (por ejemplo, x + 1).
• El efecto total incluye todas las posibilidades en las que X puede influir causalmente en Y.
En el DAG, estas son todas las posibilidades de que X llegue a Y en las que solo intervienen rutas en la dirección de la flecha («rutas causales»).
• Para determinar qué variables deben controlarse al estimar el efecto total de X sobre Y, hemos discutido el criterio de puerta trasera.
Ein Pfad von X nach Y ist im DAG…
Ein Pfad ist offen, wenn…
Ein Pfad ist geschlossen, wenn…
Ein Backdoor Pfad von X nach Y ist…
Welche Pfade sind potentiell gefährlich? Wieso?
Offene Pfade werden geschlossen, wenn…
Geschlossene Pfade werden geöffnet, wenn…
Wenn auf demselben Pfad für einen Collider und für einen nicht-Collider kontrolliert wird, ist der Pfad…
Möchte man einen offenen Pfad schließen, wird durch…
• Una ruta de X a Y es una conexión en el DAG para llegar de X a Y a través de una o varias flechas sin visitar una variable más de una vez. La dirección de las flechas no importa.
• Una ruta está abierta si no contiene ningún colisionador. Una ruta está cerrada si contiene un colisionador.
• Una ruta trasera de X a Y es una ruta de X a Y en la que una flecha apunta a X. Estas rutas son potencialmente peligrosas, ya que pueden contener factores de confusión del efecto causal de X sobre Y. Las rutas traseras que contienen un colisionador están cerradas y, por lo tanto, no son peligrosas.
• Las rutas abiertas se cierran cuando se controla una variable (o varias) en la ruta que no es un colisionador.
• Las rutas cerradas se abren cuando se controla una variable en la ruta que es un colisionador.
• Si se controla en la misma ruta un colisionador y un no colisionador, la ruta se cierra.
• Si se desea cerrar una ruta abierta, al controlar una variable a veces se abre otra ruta (hasta ahora) cerrada, que a su vez debe cerrarse (y así sucesivamente).
Was ist ein direkter kausaler Effekt?
Was muss man machen, um die Schätzung des direkten kausalen Effekts von X auf Y machen zu können?
Efecto causal directo de X sobre Y: cambio esperado en Y cuando se manipula X (por ejemplo, x + 1), que va directamente de X a Y y en el que no intervienen otras variables Z excepto X e Y (es decir, todas las demás variables del DAG siguen teniendo el mismo valor que si X no se hubiera manipulado). El efecto directo corresponde en el DAG a la flecha X -> Y.
Para estimar el efecto causal directo de X sobre Y es necesario:
• Cerrar todas las rutas de puerta trasera abiertas.
• Cerrar todas las rutas abiertas en las que se llega de X a Y a través de otras variables M (mediadores) y solo se mueve en la dirección de la flecha («rutas causales»).
• Si al cerrar las rutas abiertas necesarias se abren nuevas rutas, estas también deben cerrarse (y así sucesivamente).
Efecto causal indirecto de X sobre Y: cambio esperado en Y cuando se manipula X (por ejemplo, x + 1), que se produce exclusivamente a través de otras variables M (mediadores) entre X e Y. En el DAG, estas son todas las posibilidades de llegar de X a Y en las que solo intervienen rutas en la dirección de la flecha («rutas causales»), pero sin el efecto directo X -> Y. Si hay varios mediadores (o varias «cadenas causales») entre X e Y, los efectos indirectos correspondientes también pueden considerarse por separado.
• La estimación de los efectos causales indirectos es muy complicada en el caso general (sin supuestos simplificadores como la linealidad y la ausencia de interacciones) y no se tratará más en esta clase.
• (En la siguiente diapositiva hacemos precisamente estos supuestos simplificadores).
Gesetzmäßigkeiten für die direkten, indirekten und
totalen Effekte von X auf Y in linearen Strukturgleichungsmodellen ohne Interaktionen (3)
direkter Effekt entspricht…
Ein indirekter Effekt entspricht…
Der totale Effekt entspricht…
En los modelos de ecuaciones estructurales lineales sin interacciones, se aplican las siguientes reglas simples para los efectos directos, indirectos y totales de X sobre Y:
• El efecto directo, es decir, la flecha X -> Y, tiene un valor numérico claro. Corresponde al coeficiente de pendiente en una regresión lineal (múltiple) o sea Steigungskoeffizient.
• Un efecto indirecto (X -> M -> Y o X -> M1 -> M2 -> Y) corresponde al producto de todos los pesos de ruta en la ruta causal correspondiente.
• El efecto total corresponde a la suma del efecto directo y todos los efectos indirectos.
• En lugar de estimar los efectos causales totales, directos e indirectos utilizando varios modelos de regresión (incluidas las variables de control necesarias en cada caso, basadas en las reglas de la inferencia causal), en el contexto del SEM (bajo ciertas suposiciones, véase más adelante) es posible la estimación conjunta de todos los efectos causales dentro de un único modelo SEM.
• El principio de la mediación funciona exactamente igual en los SEM en los que todas (o solo algunas) de las variables que participan en la mediación son latentes.
• Por lo tanto, un modelo con una mediación latente contiene una mediación en el modelo estructural, así como modelos de medición para todas las variables latentes que participan en la mediación.
Welche sind direkte kausale Effekte hier?
Schätzung der Indirekte Effekte?
R Syntax dafür?
se = "bootstrap" in der cfa() Funktion im lavaan Paket
Woher weißt du, dass es um die Schätzung der Effekte/latente Mediation geht?
????
Interpretiere
Was muss gemacht werden, wenn es Confounder gibt?
Si existen factores de confusión (por ejemplo, aquí las variables U1, U2, U3, U4) entre las variables X, M e Y, al estimar los efectos causales se deben controlar estos factores de confusión, ya sea mediante...
• su inclusión en el modelo estadístico, o
• la aleatorización de X y/o M.
• Para estimar el efecto causal total de X sobre Y, basta con controlar los factores de confusión U1, U3 y U4 (por ejemplo, mediante la aleatorización de X).
• Para estimar los efectos causales directos e indirectos, además del control experimental de todos los factores de confusión U1, U2, U3 y U4, también es necesaria la aleatorización de M (la aleatorización de X por sí sola no es suficiente).
• Problema: en cuestiones psicológicas, M es a menudo una variable para la que no es tan fácil realizar una aleatorización (por ejemplo, los rasgos de personalidad). Al mismo tiempo, a menudo existen factores de confusión que son muy difíciles de evaluar (por ejemplo, las influencias genéticas).
• La dirección de los efectos causales entre las variables X, M e Y debe justificarse teóricamente.
• La dirección causal no puede comprobarse (en la mayoría de los casos) mediante pruebas de modelos e índices de ajuste, ya que en el modelo de mediación (simple) todos los modelos con diferentes direcciones causales son equivalentes (véase VL1 sobre DAG).
• Todos los modelos equivalentes se ajustan siempre igual de bien a los datos. No se pueden distinguir mediante pruebas de modelos e índices de ajuste, ya que todos los modelos equivalentes tienen siempre el mismo ajuste de modelo.
• En los modelos de mediación latentes se asume implícitamente que los modelos de medición para las variables latentes están especificados correctamente. Por regla general, se parte aquí de una estructura simple (X, M, Y tienen cada uno
sus propios indicadores, es decir, cada indicador solo carga una de las variables).
• La existencia de errores de medición correlacionados (posibles razones: cargas secundarias no consideradas, influencias causales externas no consideradas en todas las respuestas a los ítems, como por ejemplo los estilos de respuesta) suele dar lugar a sesgos en la estimación de los efectos totales, directos e indirectos.
Was können Lineare Strukturgleichungsmodelle (SEMs) insgesamt gut?
Einschränkungen?
Los modelos de ecuaciones estructurales lineales (SEM) son extremadamente flexibles en su aplicación. Se pueden modelar y probar, entre otras cosas:
- Estructuras factoriales
- Modelos de medición
- Mediaciones, moderaciones
- Diferencias entre grupos
- Modelos de curvas de crecimiento
Sin embargo, como siempre, existen importantes limitaciones. Por ejemplo:
- La causalidad no se puede deducir de un modelo adecuado (solo se aplica lo siguiente: «Si el modelo causal es válido, entonces se deduce...»). A menudo hay modelos equivalentes con una estructura causal completamente diferente. Sin embargo, esto se aplica
a todos los modelos estadísticos (por ejemplo, la regresión de Estadística 2)
- Aunque la prueba del modelo 𝜒2 es la más fiable para detectar modelos mal especificados, no tiene en cuenta la gravedad de la violación del modelo.
Zuletzt geändertvor einem Monat