Wann brauchen wir eine logistische Regression?
Wenn die AV kategorial ist!
In unserem Fall: Dichotom Kategorial
(nur 2 Ausprägungen, z.B. ja und nein)
Warum sigmoide, nicht lineare Funktion?
Würde man eine lineare Funktion verwenden, ergäben sich bei einer metrischen Uv mit unbeschränktem Wertebereich theoretisch unmögliche Werte (d.h. bedingte Wahrscheinlichkeiten <0 oder >1)
Die sigmoide Funktion strebt gegen 0, wenn X gegen minus unendlich strebt und gegen 1, wenn X gegen plus unendlich
—> 0 und 1 können hier nicht überschritten werden
residuen können nicht normalverteilt sein (weil ausprägungen sind ja nur 0 und 1)
Annahme der Homoskedastizität ist verletzt (die bedingten Varianzen der Residuen hängen bei dichotomen AVs von der Ausprägung der UVs ab)
Was sind drei Darstellungsformen der logistischen Regression?
Bedingte Wahrscheinlichkeit
Bedingter Wettquotient (Chance)
Bedingter logarithmierter Wettquotient (Logit)
Was bedeutet das Regressionsgewicht Beta_0?
Parameter Beta_0 bestimmt die Wahrscheinlichkeit, dass Y den Wert 1 annimmt, wenn X=0 ist
Je größer Beta_0, desto größer ist die (bedingte) Wahrscheinlichkeit
Was bedeutet das Regressionsgewicht Beta_1?
Was ist der Wettquotient?
auch Chance/ Odds
Verhältnis aus Wahrscheinlichkeit eines Ereignisses P (Y = 1) und seiner Gegenwahrscheinlichkeit 1 - P ( Y = 1 ) bzw.
P ( Y = 0 )
Das Ergebnis ist: Es ist … mal wahrscheinlicher, dass eine Person … macht als dass sie … macht.
Was ist das Wettquotientenverhältnis?
auch Chancenverhältnis bzw. Odds Ratio
Zusammenhangsmaß für dichotome Variablen
Verhältnis der Wettquotienten von 2 Gruppen
Voraussetzungen für eine logistische Regression
Korrekte Modellspezifikation
AV ist bedingt binomialverteilt gegeben der Ausprägungen der UVs
Beobachtungen sind unabhängig voneinander
Stichprobe ist hinreichend groß (möglichst n>100)
Zuletzt geändertvor 10 Monaten