Motivation der multiplen Regression
Frage: Kann Vorhersage einer Regression durch weitere Prädiktoren verbessert werden?
-> Vergleich zu Graphen ohne zweite vorhersagende Variable (Prädiktor)
Konfundierung von Variablen
Wie kann Konfundierung verschiedener Effekte verhindert werden?
durch multiple Regression
-> Kontrolle von konfundierenden Effekten
Prinzip der Multiplen Regression
als Matrix ausgedrückt
Linearkombination bedeutet x1y + x2y + x2y + …
Wahl der Regressionsgewichte
was bedeutet die Formel mit b?
Inversion geht nur bei vollem Rang
-> das heißt, die Prädiktoren dürfen nicht linear abhängig sein
-> denn dann gäbe es keine eindeutigen Regressionskoeffizienten mehr
Bestimmung der Regressionskoeffizienten
b (Prädiktoren) so wählen, sodass die Residuen möglichst klein sind
Worum geht es bei der Kontrolle von Effekten bei der Multiplen Regression?
Rausrechnen von Effekten einer Variable auf die anderen
Ansatz zur Kontrolle von Effekten
interpretiere das
Probleme, die bei der Kontrolle von Effekten auftreten können
bei Nicht-Linearität nicht möglich -> wir können nur lineare Effekte aus der anderen Variable rausrechnen
evtl. Verzerrungen durch zu viele Kontrollvariablen
Interpretation der Koeffizienten: b0
y-Achsenabschnitt
Interpretation der Koeffizienten: Steigungen (b1, …)
Skalenabhängigkeit der Koeffizienten
Hintergrund Determinationskoeffizient
Quadratsummen
Gesamte Quadratsumme: Streuung der Daten um den Mittelwert
Erklärte Quadratsumme: Streuung der Differenz zwischen vorhergesagten Werten und Mittelwert
Residuen-Quadratsumme: die verbleibende Streuung, die das Modell nicht erklären kann, also die Differenz zwischen den tatsächlichen Werten und den vorhergesagten Werten
Definition Determinationskoeffizient
gibt den Anteil der Gesamtvarianz an, der durch das Modell erklärt wird
Determinationskoeffizient: perfekte Vorhersage
Determinationskoeffizient: wenn Prädiktoren Vorhersage nicht verbessern
Bedingter Erwartungswert
Modell der linearen Regression
Aspekte des Bedingten Erwartungswerts
Aspekt 1: Bedingter Erwartungswert von y ist lineare Funktion der Prädiktoren
-> „An jeder Stelle ist durchschnittliche Abweichung Null”
Aspekt 2: Bedingte Varianz von y ist konstant (Homoskedastizität) -> Varianzhomogenität der Subpopulaitonen
-> „Schwankung um Regressionsgerade ist an jeder Stelle gleich“
Aspekt 3: Residualkomponenten verschiedener Personen sind unkorreliert
-> „Residuen verschiedener Personen schwanken unsystematisch“
Linear additives Modell
-> was heißt das?
-> durch additiven Zsmhang Verschiebung in y-Richtung
-> sonst gäbe es Interaktionen
-> Alk & Diazepam sind unabhängig voneinander
Was bedeutet Erwartungstreue und Konsistenz?
Wie kann man das in Formel sehen?
Best Linear Unbiased Estimator (BLUE)
Populationsdeterminationskoeffizient
2 Probleme bei Korrektur des Populationsdeterminationskoeffizienten
Strichprobenkennwerteverteilung
-> wie sind die geschätzten Werte verteilt?
Einflussgrößen auf Varianz von beta
große Stichprobe
groe Prädiktorvarianz
geringe Prädiktorkorrelationen
geringe Residualvarianz
-> dann geringe Varianz von Schätzer
Hypothesentests: Tests einzelner Regressionskoeffizienten (einzelner Präditkoren)
-> mit welchem Kennwert (t/z/…; wie sieht die Formel aus); was ist die H0?
-> was sind die Freiheitsgrade?
Signifikanztest für Set von Prädiktoren
-> Prinzip?
Signifikanztest für Set von Prädiktoren Beispiel
Signifikanztest für Set von Prädiktoren:
2 Modelle
Wie werden das volle und reduzierte Modell miteinander verglichen? (welcher Test?)
Welche 2 Tests macht man bei Testen von mehreren Prädiktoren?
alle Präditkoren -> ob mindestens einer
alle Prädiktoren außer einer
Woran kann es liegen, wenn dieses Ergebnis kommt?
Ablehnungsbereich von Tests
Fazit
Zuletzt geändertvor 8 Tagen