Korrelationskoeffizient nach Pearson
-> was gibt er an?
-> welche Werte kann er annehmen?
Was gibt er an?
die Stärke des linearen Zusammenhangs zwischen zwei Variablen
betrachtet aber im Gegensatz zur linearen Regression nicht die Steigung des linearen Zusammenhangs
kann nicht-lineare Zusammenhänge nicht gut messen
Pearson rechnet mit Originaldaten
Welche Werte kann er annehmen?
-> Werte zwischen -1 und 1
> 0 = positiver linearer Zusammenhang
0-0,1 keine bis geringe Korrelation
0,1-0,5 schwache Korrelation
0,5-0,8 mittlere Korrelation
0,8-1 starke Korrelation
< 0 = negativer linearer Zusammenhang
= 0 = kein linearer Zusammenhang
Spearman-Korrelationskoeffizient
was wird gemessen?
Was wird gemessen?
die Monotonie des Zusammenhangs
ist robuster gegen Ausreißer
aber im Falle eines linearen Zusammenhangs nicht so sensitiv wie der Pearson-Koeffizient
Spearman rechnet mit Rängen
Simpson’s Paradoxon
eine Statistik fällt unterschiedlich aus
je nach dem ob man alle Samples mit einbezieht oder die Statistik für Teilgruppen aufschlüsselt
Wofür werden Scatter-Plots verwender? (Streudiagramme)
-> um die Stärke der Beziehung zweier numerischer Variablen darzustellen
Confounder
= eine dritte Variable, die mit den beiden interessierenden Variablen X und Y assoziiert ist
-> kann deren Beziehung stören
-> deshalb ist Korrelation nicht gleich Kausalität
“Störfaktor”
Odds Ratio
Odds = Chance
die Odds einer Wahrscheinlichkeit P = P / (1-P)
-> gibt an, wie viel mal wahrscheinlicher das Ereignis eintritt als dass es nicht eintritt
Bsp: Odds für eine Krankheit unter Exposition vs unter nicht-Exposition
Odds-Ratio
= Chancenverhältnis, OR
eignet sich als Maß für den Zusammenhang zwischen zwei Variablen
gibt an, um wie viel größer die Chance ist, an der Krankheit zu leiden, wenn man exponiert ist
Werte -> liegen zwischen 0 und unendlich
< 1 = Exposition wirkt präventiv
> 1 = Exposition wirkt schädlich
1 = Exposition hat keinen Einfluss
Anwendung
bei Fall-Kontroll-Studien und Kohortenstudien
bei niedrigen Risiken: relatives Risiko & OR ca gleich
bei hohen Risiken: OR immer größer als rel. Risiko
Relatives Risiko
man vergleicht zB das Risiko für eine Krankheit unter Exposition mit dem Risiko für die Krankheit unter Nicht-Exposition
nur in Kohortenstudien sinnvoll interpretierbar
Logistische Regression
-> modelliert den Zusammenhang zwischen einer oder mehrerern Einflussgrößen und einer dichotomen Zielgröße (zB Lungenkrebs ja/nein)
binäre logistische Regression
-> der Zusammenhang zwischen Ziel- und Einflussgröße wird mit dem Odds-Ratio beschrieben
Zuletzt geändertvor 2 Jahren