Wie lautet das Standardmodell der multiplen Regression nach dem Least-Squares-Ansatz?
was heißt das?
Was ist wichtig dabei?
Wieso ? ;)
Welche Annahme ist in gruppierten Strukturen festzustellen? / Interessant/problematisch?
Unabhängigkeit der Beobachtungen bzw. Fehler ist aber selten gegeben:
Ø Abhängigkeit kann immer dann vorliegen, wenn mehrere Beobachtungen zu einer sinnvoll definierten „Gruppe“ oder „Cluster“ gehören
Ø Beispiele:
• Schüler*innen sind Schulen zugeordnet
• Patient*innen sind Therapeut*innen zugeordnet
• Messzeitpunkte sind Personen zugeordnet
Welche Unterteilungen werden häufig wenn mehr als 1 _____________________ liegt vor?
Wie heißen die Daten mit mehreren Ebenen?
Was definiert jeder Ebene?
Beispiele?
Y = ?
a) Y = AV (DV)
b) Y = UV (IV)
porque Xk = UV (IV) (predictores)
Welche sind die implikationen und Folgen der gruppierten Datenstrukturen?
Wie lässt sich Abhängigkeit in den Fehlern darstellen?
Zwei einfache Möglichkeiten:
1. Grafisch-deskriptiv
2. Intraklassenkorrelation (ICC)
Wie streuen diese Residuen und was bedeutet dies?
Wie lässt sich Ausmaß der Abhängigkeit in den Fehlern in einem Wert erfassen?
Intraklassenkorrelation (ICC)
Was ist diese Gleichung und wofür steht jede Expresion?
Welche sind 3 Mögliche Umgänge mit gruppierten Daten?
Aggregation: Hauptproblem: Ökologischer Fehlschluss
Disaggregation: Hauptproblem: Erhöhte Typ-I-Fehlerrate bei L2-Variablen; ignoriert Variabilität der Gruppen
no pooling: Hauptproblem: Overfitting in einzelnen Gruppen; wie fasst man die vielen Modellparameter optimal zusammen?
Was ist Aggregation und welche ihre Probleme?
Aggregation
• Reduktion der Anzahl der Personen-Werte auf Anzahl der Gruppierungsvariablen-Fälle.
• Statt „1200 Schüler*innen in 47 Klassen“ schaut man sich also nur noch „47 Klassen an“
• Aggregation der Personen-Werte in den Prädiktoren und dem Kriterium durch Mittelwertsbildung innerhalb der Gruppierungseinheiten.
• Dann Regressionsschätzung der mittlen Kriteriumswerte aus mittleren Prädiktor-Werten durchführen.
Erkläre worin besteht?
Beispiele für den ökologischen Fehlschluss:
(L1 = wiederholte Messung, L2 = Personen)
• Speed-accuracy-trade off
—> Höhere Geschwindigkeit geht mit weniger Fehlern einher
(zwischen Personen)
—> Höhere Geschwindigkeit geht mit mehr Fehlern einher
(innerhalb von Personen)
Training und Müdigkeit
• Mehr Training führt zu weniger Müdigkeit (zwischen Personen)
• Mehr Training führt zu mehr Müdigkeit (innerhalb von Personen)
Unter welche Bedingingen kann man von Ebene zu Ebene schließen? Wie heißt das und ansonsten um welche Fehler handelt es sich?
Ergodizität
1. Homogenität: Das selbe statistische Modell gilt für jede Gruppierungseinheit auf L2 (z.B. Personen)
2. Stationarität: Der psychologische Prozess auf L1 muss stationär sein (d.h., konstante statistische Charakteristika über die Zeit aufweisen – gleicher MW, SD, Faktorladungen, etc. an jedem Zeitpunkt).
Man kann prinzipiell nicht von Zusammenhängen einer Aggregationsebene auf die Zusammenhänge auf einer anderen Aggregationsebene schließen! Ökologischer Fehlschluss
Was ist Disaggregation und welche ihre Probleme?
Disaggregation ist:
• So tun, als gäbe es keine Gruppierungsstruktur
• „Vervielfachung“ der L2-Variablen
• Jeder Person wird in einer neuen Variable der jeweilige Wert der Gruppierungs-Variablen zugewiesen.
– Jeder Schülerin die Größe ihrer Klasse
– Jedem Patienten der Code der Klinik, in der er behandelt wird
– Jeder Angestellten der Durchschnittsverdienst einer Abteilung
—> Dann Berechnung einer Regression mit dieser neuen Variable als Prädiktor.
Welches Hauptproblem hat die Disaggregation?
Disaggregation: Hauptproblem: Erhöhte Typ-I-Fehlerrate bei L2-Variablen; ignoriert Variabilität der Gruppen.
Probleme bei Disaggregation:
• Werden Unterschiede zwischen Gruppen untersucht
(bspw. Leistungsunterschiede zwischen Klassen
unterschiedlicher Größe):
Alpha-Fehler-Kumulierung bei L2-Prädiktoren wegen
künstlicher Vervielfachung des Stichprobenumfangs
à Power von Hypothesentests wird überschätzt
• Ignoriert Unterschiede zwischen Gruppen
• Genau eine Regressionlinie für alle
Was ist no pooling and welches Problem hat?
Zuletzt geändertvor einem Monat