Kreisdiagramme
Block oder Stabdiagramme
zentraler Winkel = proportional zur relativen Häufigkeit der Merkmalsausprägung
nicht für ordinal skal Merkamale, keine RIchtung
Höhe eine Blocks/Stabs entspricht der relativen Häufigkeit einer Merkmalsausprägung
auch für ordinale Merkmale geeignet, Anordnung der Blöcke kann der ordinalen Struktur nach gewählt werden
quantitative Merkmale, grafische Darstellung
Vielzahl an Ausprägungen, Block, Stab unsinnig -> Bildung von Klassen, ANgabe von absoluten und relativen Häufigkeiten
X-Achse: Wertebereich der Merkmalsausprägungen
Y-Achse: Höhe der Blöcke = proportional zu rel Häuf der Klassen (bei gleichen Klassenbreiten)
ungleiche: dividieren durch Klassenbreit notwendig
Anzahl der Klassen: K= Vn (N< 1000) oder K = 10log(n) falls n>1000
kumulative rel. Häufigkeit, garf Drastellung
empirische Verteilungsfunktion: jeder Zahl x wird der Prozentsatz der beobachteten Ausprägung zugewiesen, der kleiner oder gleich x ist
Treppenfunktion, springt bei x-Werten die mind einmal vorkommen
quantile
eine Zahl Q, welche die sortierten Merkmalsausprägungen der Getsalt teilt, dass: Mind 100*q% der Daten <Q
100(1-q)% der Daten >Q
zB bei Boxplot
Stat MAßzahlen
Lagemaße
arithm. Mittel: bei. metrischen Merkmalen, empfindlich ggü Extremwerten (Ausreißern)
Median (Zentralwert): mitllerer Wert, der nach Größe geordneten Merkmalsauspr. (50% Quantil)
metrisch und ordinal skal, robust ggü Ausreißern
Modalwert (Modus): häufigste Auspr. eines Merkmals
alle Merkmalstypen
Streuungsmaße
Varianz:
STandardabw:
Spannweite:
Interquartilsabstand
Variationskoeff.
Qunatifizierung der Variabilität der beobachteten Ausprägungen
Varianz: Summe der quadrierten Abweichungen jedes Einzelwertes vom Mittelwert, geteilt durch n-1
Quadratwurzel der Varianz
Maximum-Minimum
q= 75%-25%-Quantil (robust ggü Ausreißern, auch ordinal)
Standardabw. in Einheiten des Mittelwerts
Korrelation
beschreibt einen (ungerichteten) Zusammenhang zweier gleichberechtigten Merkamlen + quantifiziert die Stärke des Zusammenhangs
-> Scatterplots
je srärker der Zusammenhang, umso enger schmiegt sich die Punktwolke entlang einer gedachten Kurve
Korrelationskoeffizient
nach Pearson: metrsiches Skalenniveau, zw -1 und +1
funktionale Form des Zusammenhangs ist linear
nach Spearman: Rangzahlen, mind ordinalskal.,
Zshang muss nur monoton sein, nicht linear
Korrelationsanalyse
Regressionsanalyse
ungerichteter Zshang zweier gleichberechtigeter Merkmale, nur Stärke des Zshangs (deskriptive Statistik)
gerichteter Zshang, Unterscheidung zwischen abh (Zielgröße) und uanbh (Einflussgröße) Variable
Wahrscheinlichkeitsrechning
Unahbhängikeit von Ereignissen
beeinflussen sich nicht gegenseitig
P(AnB) = P(A) * P(B)
deskriptive Statistik
Induktive Statistik
Beschreibung des konkreten Datensatzes einer Studie, alle Aussgaen beziehen sich auf vorliegendes empirisches Datenmaterial
allgemeinere Aussagen über den konkreten Datensatz hinausgehend und auf den zugrunde liegenden Bezugsrahmen der Studie schließend
>< deskriptiv: unterschiedliche Zielsetzung
Parameter
Schätzer
theoretische Größen, die sich auf die GG beziehen
die aus den Daten berechneten Größen
Punktschätzung
Intervallschätzung
liefert Wert über den interessierenden Parameter, kann nicht auch die Unsicherheit der Aussage vermitteln
geben Bereich an, in dem der interessierende Parameter mit einer vorgegebenen “Sicherheit” liegen wird, wenn man entspr. Whl der Studiendurchführung realisiert
95% Konfidenzintervall
Bereich, in dem der interessierende Parameter mit einer Wskt von 0,95 bei Whl der Szudie anzutreffen sein wird
in dem sich der int. Par. in der GG mit vorgegebenem Konfidenzniveau befindet
Goldstandard
Validität
Reproduzierbarkeit
etabliertes Diagnoseverfahren. definiert, was als tatsächlicher Zustand angegeben wird
Richtigkeit, Gültigkkeit: gemessene Daten geben das wieder, was gemessen werden soll
Reliabilität, Präzision, Wiederholbarkeit, Zuverlässigkeit: Messungen führen bei Wiederholung zum selben Ergebbnis
Güte des Tests
Sensitivität
Spezifität
Youden-Index
P(positiver Test /krank)
P(negativer Test/gesund)
Y-I = Sensitivität + Spezifität -1 (zwischen 0 und 1 ; 1 = gut)
ROC-Kurve
Cutpointbestimmung
Receiver Operating Characteristic Kurve:
Sensitivität in Abh von SPez. dargestellt
Punkt, bei dem Kranke und Gesunde am besten getrennt werden (Abstand zur Winkelhalbierenden am größten)
PPW
NPW
bedingte Wskt, tats krank zu sein, wenn der Test positiv ist
bedingte Wskt tats gesund zu sein wenn der TEst neg ist
zunehmende Prävalenz: (Anzahl der zu einem bestimmten Zeitpunkt erkrankten)
PPW steigt
NPW sinkt
Unterscheidung zw einer abh und einer/mehreren uanbh. Variablen
Ziel: Auswirkung der UV auf die AV
Schätzung : y=a+ßx a: Intercept ß: Steigungsparameter
Methode der kleinsten Quadrate: Summe rder quadrierten Differenzen zwischen den beobachteten Werten und den vorhergesagten Werten (minimal)
Streuungszerlegung / Betsimmthetsmaß
r^2 : Verhältnis v erklärter Streuung zu Gesamtstreuung (zw 0 und 1)
bei einfacher linearer Regression = Quadrat des (pearson) Korrelationskoeffizienten
Überlebenszeitanalyse
staggered entry
Zensierung
Überlebenszeitfunktion
wenn keine zensierten Überlebenszeiten beobachtet werden (Schätzung)
Rekrutierung, Behandlung zu unterschiedlichen Zeitpunkten
-> Zeitachse synchronisiseren, gemeinsamer Nullpunkt
Wenn die Überlebenszeit nicht exakt bestimmbar ist, bei beobachtungsende ist interessierendes Zielereignis noch nicht eingetreten
Wskt, den Zeitpunkt t zu überleben S(t)=P(T>t)
S(t) = üt/n (üt = ANzahl der den Zeitpunkt t überlebenden)
Kaplan-Meier-Methode
Überlebenszeitfunktion S wir an den Stellen tj aus euner Rekursionsformel für S bestimmt
Statistischer Test
Hypothesen H0 H1
ENtscheidungsverfahren, das über formulierte Vermutung (Hypothese) nach Sammlung von empirischer Information konkrete ENtscheidung trifft
= Methode der induktiven Statsistik
Nullhypothese H0: enthält die zu widerlegende Aussage
ALternativhypothese H1: enthält die zu beweisende Aussage
Fehler 1. Art (a)
Fehler 2. Art (ß)
einsietiger stat Test
zweiseitiger stat Test
SIgnifikanzniveau
H0 wird abgelehnt obwohl sie zutrifft
H0 wird nicht abgelehnt obwohl sie nicht zutrifft
“Kontrolle” des Fehlers 1. Art (a) nur in eine RIchtung notwendig
“Kontrolle” des Fehlers 1. Art (a) in beide Richtungen notwendig
bei einseitigem Testen eher Ablehnung der H0 als bei zweiseitigem Testen
a=0,01, falls ein Fehler 1. Art gravierende Konsequenzen hat, Fehler 2. Art zu tolerieren
a=0,10 falls ein Fehler 2. Art gravierende Konsequenzen hat, Fehler 1. Art zu tolerieren
Statistische Power
wskt, mit der ein statistischer test eine SPezifische richtige Alternative als solche entdeckt (faksche H0 ablehnt)
Abh. von der Fallzahl
Abh. von konkreter Alternative
Abh. vom Signifikanzniveau
Einstichprobentest
Zweistichprobentest
Analyse von nur einer Gruppe von unabh. Merkmalsträgern hins. der Verteilung der Merkmalsausprägungen
-> Einstichproben t-Test, Binomaltest
Testverfahhren abh. vom Merkmalstyp der beobachteten Mmausprägung
Abhängigkeiten der. beiden Stichproben
unverbundene Stichproben: t-Test unv Stichpr, U-Test, Chi-Quadrat, Logrank
verbundene STichproben: t-Test verb. Stichpr, Wilcoxen-Rangsummen, McNemar
Einstichproben t-Test
Binomialtest
unabh. Messgrößen, Verteilung aus einer Normalvert.
n-1 Freiheitsgrade (beliebige H0 mgl)
unabh dichototome Messgrößen, Verteilung stammt aus Binomalverteilung
t-Test für zwei unverbundene Stichproben
unabh Messgrößen, Normalverteilung
nx + ny -2 Freiheitsgrade
U-test (mann whitney wilcoxon)
t-test für zwei verbundene Stichproben
Chi-Quadrat Test
Logrank Tests
unabh. Messgrößen mit beliebiger Verteikung, Ränge werden vergeben (nach Größe geordnete Messgrößen)
unabh Wertepaare, normal verteilte Messgrößen, Di= Differenz Xi-Yi (ebenfalls aus Normalverteilung)
(Nullhypothese: ob Erwartungswert gleich null ist)
unabh. Beobachtung dichotomes Merkmal, 1 Freiheitsgrad
zwei unv Stichproben, nichtparametrisches Testverfahren, keine Voraussetzungen an die Verteilung ; Überlebenszeitfunktion stimmen überein
Wilcoxon-Vorzeichen-Rangsummen-Test
t-test zwei verbund. Stichproben
McNemar-Test
unabh Wertepaare, DIfferenz Di hat beliebige Verteilung,
Absolutbeträge werden der Größe nach vergeben (Rangzahlen)
unabh Wertepaare, normalverteilt, Differenz, n-1 Freiheitsgrad
unabh Wertepaare, dichotom, rel Häufigkeit, ein Freiheitsgrad
Mortalität
Letalität
Morbidität
Anzahl von Personen pro Zeiteinheit, die an einer Ursache versterben
Anteil von Personen, die eine best Erkrankung haben und daran versterben
“Erkrankungszustand” =ungenau
Prävalenz
Inzidenz
Kumulative Inzidenz
Inzidenzdichte
Zahl bestehender Fälle/Gesamtpopulation
Zahl Neuerkrankungen pro Zeit/Population pro Zeit
Zahl der Neuerkrankunegn / Population
Zahl der Neuerkrankkungen / Personenzeit (Beobachtungszeit gesund und unter Risiko)
Querschnittsstudie
Längsschnittsstudie
Unters. representative Stichprobe aus der interessierenden Grundgesamtheit an einem Stichtag
(keine Inzidenz ermittelbar, keine seltenen KH, keine Evidenz für Kausalität)
2 Gruppen (Exp + nicht Exp) werden über einen definierten Zeitraum hinsichtlichs des Risiskos der merkmalsausprägung untersucht
indirekt standardisierte Mortalitäts/Morbiditätsraten Ratio
SMR= gefundene Rate/erwartete Rate
Kohortenstudie
geschlossene, fixe
offene, dynamische
Personengruppen, ein betsimmtes Merkmal gemeinsam
beob aller gemeinsamen Startpunkt über einen festen Zeitraum
individuelle Start und Endpunkte für einzelne Peronen
Risikofaktoren
Faktoren, die mit einer Erkrankung assoziiert sind
relatives Risiko
Odds Ratio
Attribuables Risiko
Verhältnis zwischen Inzidenz in einer Population, die einer Exposition ausgesetzt ist, und der Inzidenz, die in der Population aufträte wenn keine Exposition vorgelegen hätte
STärke des Zshangs von zwei Merkmalen
Mß für die Auswirkung eines RF auf Bevölkerungsebene, berücksichtigt, wie häufig die Exp in der Bev vorokommt
Beobachtung von neu über einen Zeitraum aufgetretenen Ereignissen (= prosep oder retrospek Längsschnittstudie)
+ zeitliche Abfolge klar, Assoziation auf Kausalität und Inzidenzberechnung
+ biasfreie Exp.ermittlung
+ mehrrere KH untersucht und seltene
- auf¨wandig, teuer
- seltene KH, große Kohorten
- lange Zeit bis Ergebnisse vorliegen
Fall-Kontroll Studie
Vgl von neu erkrankten Personen mit nicht erkr Personen
Nur Odds Ratio berechenbar
Kontrollen sollen representativ sein, gleichzeitig mit Fällen rekrutiert
+ effizient für seltene Erkr.
+ weniger Zeit und Kostenaufwand als Kohortenstudien
+ mehrere RF untersuchen
- Recall Bias
- Selection bias
- uneffizient für seltene Expositionen
Fehlertypen
Error
Bias
Maßnahmen gegen COnfoudnig
Vorüberlegung zu potentiellen Confoundern (restr. EInschlusskriterien, Matching)
mgl stat Verfahren in der Auswertung (Standardisierung, strat Analyse, multiple Analyse)
EBM
syst. Übersicht
meta-analyse
anwendung des besten verfügabren Wissens in der tgl Patientenversorgung
5 Elemente
EInbezug aller zugänglichen Einzelstudien nach klar definierten Kriterien
quantitativer Zusammenfassung von EInzelstudien Ergebnissen mit stat Methoden, ausreichende Homogenität
Fallstricke: Publiaktionsbias (nur studien, die einen Effekt zeigen)
Selektionsbias (nur englischsprachige Studien)
Zuletzt geändertvor 2 Jahren