Binäre Klassifikation
nicht-binäre Klassifikationsaufgabe
Lineare Regressionsanalyse
Logistische Regressionsanalyse
-> Beschreibt die Regressions mit nicht nur metrischen Werten, wie bei der Kaufentscheidung -> Nutzung Dummy Variablen
-> Nutzung einer logistischen Regressionsfunktion
Nicht lineare Regressionsanalyse
Ablauf einer Regressionsanalyse
Residualgröße und Berechnung von b1, sowie b0
y = beobachteter wert, y Dach = Schätzwert
Methode der kleinsten Quadrate
Korrelationskoeffizienz
Kovarianz
-> Kovarianz gibt keine Aussage über Stärke des linearen Zusammenhangs, je höher ist nicht gleich einem stärkeren Zusammenhang » Daher: Normierung über Standardabweichung → Korrelationskoeffizienten -> Verhältnis des Zusammenhangs möglich
Overfitting
Das Modell wird zu sehr an die Traingsdaten angepasst
neue Daten haben kein gutes Ergebnis
Verzerrung und Varianz
Kreuzvalidierung
Prüfung der Regressionsanalyse
-> Wird verwendet, um zu schauen, wie die Regressionskoeffizienten ohne Einheit verglichen werden
Standardisierung Regressionskoeffizienten
Standardfahler - Root Mean Squared Error
Bestimttheitsmaß R²
korrigiertes Bestimmtheitsmaß
Prüfung der Modellprämissen
Wenn eine dieser Verletzungen der Prämissen auftritt, dann ist die Regressionsanalyse mit Vorsicht zu interpretieren
Homskedastizität vs Hetroskedastizität
Homoskedastizität bedeutet in der Statistik, dass die Varianz der Fehler (Residuen) in einem Regressionsmodell über alle Werte der unabhängigen Variablen hinweg konstant ist.Heteroskedastizität ist das Gegenteil: Die Varianz der Fehler ist nicht konstant, sondern ändert sich in Abhängigkeit von den unabhängigen Variablen.
Last changed14 hours ago