Was ist der Hintergrund der logistischen Regression?
lineare Regression modelliert metrisch/ stetig Variablen Y; in Epidemiologie dagegen oft binäre Zielvariable
Modellierung binärer Variablen erfordert gesonderten Ansatz
Welche Mittel zur Modell-Diagnostik gibt es?
AIC
Konfusionsmatrix und accuracy
Boxplot
Residual-Devianz sollte nicht deutlich über Freiheitsgrade liegen
Modell-Diagnostik Boxplot
Vorhersage/ Schätzung der Wahrsheinlichkeit basierend auf Modell
direkter Vergleich im Datensatz
viseller Vergleich im boxplot
Modelldiagnsotik AIC
Vergleich von Modellen bei identischem Datensatz
-> je kleiner, desto besser die Anpassung
bei nicht identischen Datensätzen AICnorm = AIC/n
Modelldiagnostik Likelihood-Ratio-Test
nur bei verschachtelten Modellen zulässig
basierend auf Chi2-Test
wenn signifikant, dann bietet 2. Modell mehr Erklärungsgehalt
Modelldiagnostik Konfusionsmatrix
Accuracy
Precision
Sensivität
Spezifität
korrekte Vorhersage/ Gesamtzahl an Vorhersagen = (a+d)/n
im Optimalfall >= 50%
Anteil korrekter Vorhersagen/ Anzahl pos. Vorhersagen = a/(a+b)
Anteil korrekter Vorhersagen/ Anzahl pos. Beobachtungen = a/(a+c)
Anteil korrekter Vorhersagen/ Anteil neg. Beobachtungen = d/(b+d)
Annahmen des logistischen Regressionsmodells
jede Bobachtung ist Ergebnis eines Bernoulli-Experiments
Bernoulli Wahrscheinlichkeit ist gegeben durch die logistische Funktion
Koeffizienten sind für alle Einheiten i konstant (identsich)
Beobachtungen yi sind stochastisch unabhängig gegeben die erklärenden Merkmale xi1, xi2
Erläutere das Grundprinzip der logistischen Regression
Vorhersage/ Erklärung der Wahrscheinlichkeit, dass das interessierende Ereignis unter Berücksichtigung der UV eintritt
Wahrscheinlichkeit liegt zwischen 0 und 1 (daher nicht mit linearen Modell moedellierbar)
stattdessen wird logit-Funktion genutzt
Logarithmus der Chancen (Odds)
logit(p) = ln(p/1-p)
Warum werden logits genutzt?
Wahrscheinlichkeiten liegen zwischen 0 und 1
logits liegen auf unendlicher Skala (lineares Modell kann verwendet werden)
Interpretation über e^b
Wie werden Regressionskoeffizeinten geschätzt und interpretiert?
Last changed11 days ago