4.1 Grundlagen der einfachen linearen Regressionsanalyse
Unabhängige Variable / Abhängige Variable
unabhängige Variable X ( auch Prädiktor genann) kann Einfluss auf eine andere Variable nehmen
abhängige Variable Y (Kriterium genannt) wird durch eine oder mehrere unabhängige Variablen beeinflusst
Im Streudiagramm unabhängige X immer wird immer auf der x Achse und Y immer auf y Achse eingetragen
einfache lineare Regressions
bestimmt Regressionsgerade für Zusammenhang zwischen einer unabhänigen Variablen X und einer abhängigen Variablen Y
4.2 Bestimmung der Regressionsgerade
Bestimmung lineare Gerade
Lineare Funktion nimmt grundsätzlich Gestalt von
y unten i = a+b mal x unten i
Parameter a ist ist y Achsenabschnitt einer linearen Funtion
b beschreibt entsprechende Steigung
Punktewolke soll gut durch lineare Gerade beschrieben werden
Methode der kleinsten Quadrate dafür verwenden
Residuum
Abstand zwischen dem tatsächlichen Wert y und auf Basis der Regressionsgeraden geschätzen y Wert
immer das Dach auf einer Variablen verwenden wenn ein Wert auf Basis bzw Regressionsgeraden geschätzt wird
Ziel Methode der kleinsten Quadrate
Summer der Fehler zu minimieren
Berechnung der Koeffizienten der linearen Regression
Formeln für a und b ( ergeben sich durch die Methode der kleinsten Quadrate)
mit b beginnen weil für Berechnung von a braucen wir Ergebnis von b
Formel im Skript S 103
ist Regressionskonstante gefunden
muss diese genauer betrachtet werden
Parameter a ist sogenannte Regressionskonstante (beschreibt y Achsen abschnitt der linearen Regressionsgerade)
gibt an welchen Wert y annimmt wenn x = 0 ist
Wichtiger ist Parameter b
wird auch als Regressionskoeffizient bezeichnet (beshreibt Steigung der linearen Regressionsgerade)
gib an um wievile Einheiten sich y verändert wenn x um eine Einheit zunimmt
4.3 Qualitätsbeurteilung
3 Maßzahlen um Qualität der geschätzten Regressionsgerade zu prüfen und beurteilen
Korrelationskoeffizient von Bravais - Pearson
Bestimmtheitsmaß
Standardfehler
Korrelationskoeffizient
Formel im Skript S 107
Kan Werte zwischen -1 und +1 annehmen
Nähe zur +1 bzw -1 spricht für einen starken linearen Zusammenhang
man sollte bei der linearen Regressionsanalyse mindestens einen Korrelationskoeffizienten von 0,5 oder - 0,5 haben um angemessenen linearen Zusammenhang zu haben
gibt den Erklärungsgehalt eines Regressionsmodells wieder
wichtigstes Kriterium um aufgestellte Regressionsgerade zu beurteilen
R hoch 2
Erklärte Sreuung / Nichterklärte Streuung
ist auf die unabhängige Variable zurückzuführen
nichterklärte entsteht durch nicht berücksichtigte Variablen und Messfehler
Gesamtstreuung
setzt sich aus der erklärten und nicht erklärten Streuung zusammen
beschreibt den absoluten Schätzfehler bei der Nutzung des Regressionsmodells
omega Dach unten x,y
Wert für Standardfehler ist ein absoluter Wert in der Maßeinheit der abhänigen Variablen
ob Standardfehler groß oder klein ist ist subjektive Einschätzung und schwer zu sagen
hilfe schafft der relative Standardfehler
relativer Standardfehler
gibt Standardfehler in Prozent an
omega Dach unten 0
prozentuale Abweichung des geschätzen Werts vom tatsächlich beschriebenen
Last changeda year ago