Inhalte zum Überblick
Sind Annahmen für Multiple Regression gegeben?
Welche Annahmen hat die Multiple Regression?
Linearität
Varianzhomogenität
Unabhängigkeit
Normalverteilung
Linearität der Beziehung von Kriterium-Prädiktor
3 mögliche Verstöße gegen Linearität
2 mögliche Verstöße gegen Varianzhomogenität
Unabhängigkeit (Kovarianz der Residuen)
möglicher Verstoß gegen Unabhängigkeit
Konsequenzen von den 3 Modellverstößen
(aus Klausurvorbereitung)
Residuen in Regression sind nicht beobachtbar
-> Welche Frage stellt sich?
-> woran erkennt man die Residuen?
Wie wird das Residuum e geschätzt?
Wie sind geschätzte Residuen verteilt?
Was ist die Lösung der Varianzheterogenität der Residuen?
Standardisierung der Residuen: Internal studentisierte Residuen
-> Probleme davon?
varianzhomogen, aber maskierung/begrenzter Wertebereich
Ansatz zur Standardisierung der Residuen, der Probleme von internal studentisierten Residuen behebt?
varianzhomogen und t-verteilt
Detektion von Ausreißern
-> wie?
Prinzip: Festlegung von Grenzen für auffällige Werte
Problem dabei:
erst wenn auch das Residuum auffällig, ist es ein einflussreicher Wert
Detektion von Ausreißern:
Technik
Wann ist ein Ausreißer wirklich ein Ausreißer?
wenn sowohl y-Auffälligkeit (Residuum) als auch x-Auffälligkeit (Leverage, wie weit weg der Wert ist)
-> Cook-Distanz
Modellverstoß der Normalverteilung: Graphen
-> was muss man sich dafür anschauen?
-> Residuen
Graphische Bewertung von Modellfit für alle Annahmen der Multiplen Regression
Welche Annahmen sind hier verletzt?
Probleme bei Interpreation der Plots
Plot zur Bestimmung der Normalverteilung
ze = standardisierte Residuen
Wie sieht der QQ-Plot bei …
normalverteilten
log-normalverteilten
t-verteilten
… Residuen aus?
Fazit
Zuletzt geändertvor 8 Tagen