Was sind die Ziele der einfachen linearen Regression?
Prädiktion von Merkmalsausprägungen
explorative Studien: Erklärung von Zusammenhängen
Erklärung von Merkmalsunterschieden
konfirmatorische Studien
In welchen Kontext ist die einfache lineare Regression anzuwenden?
metrische AV
nur eine UV
(entspricht t-Test falls kategoriale UV mit 2 Stufen)
linearer Zusammenhang zwischen UV und AV
Rückblick: Was sind nochmal die Eigenschaften des Mittelwerts?
Die Summe aller Abweichungen zwischen Messwerten und Mittelwert ist 0
Summe aller quadrierten Abweichungen zwischen Messwerten und Mittelwert ist minimal
Falls UV unbekannt ist der geschätze Mittelwert der beste Vorhersagewert
Was besagt das Kleinste-Quadrate-Kriterium?
Die Regressionsgerade wird so in den Punkteschwarm gelegt, dass die Summe der quadrierten Abstände zwischen Messwerden der AV und deren vorhergesagten Werten minimal wird
Was bedeuten b0 und b1 in der Regressionsgleichung?
b0
Intercept
vorhergesagter Wert y^, wenn x=0
b1
Steigung (“Slope”)
Veränderung von y^ falls x um eine Einheit zunimmt
Wie bestimmt man die Regressionskoeffizienten, damit das Kleinste-Quadrate-Kriterium erfüllt ist?
Was ist das Residuum?
“error” em
Differenz zwischen vohergesagtem Wert y^und beobachtetem Wert y bei Person m
Was sind 4 Eigenschaften der Residuen?
Was ist der Standardschätzfehler?
Varianz der Residuen = Fehlervarianz S^2E
Standardabweichung der Residuen heißt Standardschätzfehler
Je größer die Korrelation zwischen X und Y, desto kleiner der Standardschätzfehler
Varianzzerlegung und Determinationskoeffizient - Wie funktionieren sie und was machen sie?
Varianz
Varianz der abhängigen Variable Y lässt sich additiv zerlegen in durch den Prädiktor erklärte Varianz und Fehlervarianz zerlegen
Determinationskoeffizient R^2
Ergibt sich aus der Varianz
Anteil der erklärten Varianz an der Gesamtvarianz
standartisiertes Maß zur Güte der Vorhersage
0= keine Vorhersage, 1 = perfekte Vorhersage
Was passiert bei einer Regression standartisierter Werte?
Wenn man beide Variablen z-standartisiert, ergeben sich diese Regressionskoeffizienten:
—> b_0s = 0
—-> b_1s = r_xy
standardisierter Regressionskoeffizient entspricht der Korrelation (bei ELR)
Wann nutzt man unstandardisierte und wann standardisierte Regressionsgewichte?
Unstandardisiert
Vorhersage bei intuitiv interpretierbaren oder etablierten Maßeinheiten (z.B. Geld, Zeit, IQ-Werte)
Vergleich verschiedener Gruppen
Das Regressionsgewicht hat keine Ober- oder Untergrenze
Standardisiert
Vergleich verschiedener Studien mit unterschiedlichen Messinstrumenten (z.B. bei Meta-Analysen)
Notation ist häufig beta zwecks einfacherer Abgrenzung von b
Wie sieht denn ein Konfidenzintervall einer Regressionsgeraden aus?
Je weiter ein x-Wert vom Mittelwert abweicht, desto größer ist der Standardfehler des bedingten Erwartungswertes und desto unsicherer ist seine Schätzung
Deshalb: KI verläuft nicht parallel zur Regressionsgeraden, sondern bikonkav (in der Mitte schmaler, bei den Extremwerten größer)
Was sind die Voraussetzungen einer linearen Regression?
Homoskedastizität
Normalverteilung der Residuen
Unabhängigkeit der Residuen
Zuletzt geändertvor 10 Monaten