Ziel von Grafiken
Darstellung der statistischen Kennwerte einzelner Variablen Darstellung von Vergleichen der Kennwerte mehrerer Gruppen
Darstellung von Zusammenhängen zwischen zwei oder mehreren Variablen
Zusätzlich muss das Skalenniveau der jeweiligen Variablen beachtet werden.
Richtlinien
Grafiken sollten nur eingesetzt werden, wenn sie das Verständis für statistische Ergebnisse verbessern können.
Zu viele Grafiken können das Verständnis der Befunde einer Untersuchung auch erschweren. (Max 30%)
Was ist der Zweck der geplanten Grafik?
Wichtig: Die Beschriftung der Grafik (Legende) muss verständlich und vollständig sein.
Polygon
Stetige Variablen
Auf der Abszisse (x-Achse) werden die in der Stichprobe vorhandenen
Ausprägungen des Merkmals aufgetragen.
Auf der Ordinate (y-Achse) werden die absolute Häufigkeiten des Merkmals abgebildet.
Es werden nur die Häufigkeit vorhandener Merkmale veranschaulicht, somit kann die Darstellung vom Ergebniss abweichen
Histogramm
Hier werden die Rohwerte automatisch in Kategorien zusammengefasst.
Die Mitte der jeweiligen Kategorien zur Beschriftung der Kategorien auf der x-Achse verwendet.
Gerade bei sehr vielen unterschiedlichen Rohwerten einer stetigen Variablen empfiehlt sich die Verwendung eines Histogramms.
Kategorisierte Variablen
Steam Leaf Plot
Messwerte in eine Grafik umzuwandeln, so dass neben der Verteilungsform auch die einzelnen Werte der Stichprobe ablesbar sind.
Jeder Zahlenwert wird in der Abbildung realisiert.
Die ursprünglichen Rohwerte bleiben erhalten.
Es sind sowohl die Häufigkeiten der beobachteten Personen in der Kategorie als auch die einzelnen Werte innerhalb der Kategorie ablesbar.
Ein grafischer Eindruck analog zum Histogramm ist in die Rohdaten beziehungsweise innerhalb der Kategorien möglich.
Balkendiagramm
Diskrete Variablen
Auch mit Kreisdiagramm möglich
Box Plot
Vorteil: Zentrale Tendenz und Dispersion werden parallel dargestellt.
Meistens wird der Median anstatt des Mittelwerts benutzt, da dies ein besseres Maß für die zentrale Tendenz ist
IQA eintragen kumulierte 25%; kumulierte 75%
-> Höhe der Box = 50%
Whiskers Letzter vorkommender Wert im Bereich m+1,5 x IQA
Obergrenze = max ∈ [Q3, Q3 + 1.5 · IQA]
Untergrenze = min ∈ [Q1 − 1.5 · IQA, Q1]
Ausreißer (zwischen 1,5 und 3) Kreise
Extremwerte (> 3) X-se
Scatter Plot
Darstellung für die Verdeutlichung eines möglichen Zusammenhangs zwischen zwei Variablen.
Es werden Wertepaare sämtlicher Versuchspersonen zweidimensional abgetragen.
x-Achse = Werte in der ersten Variablen y-Achse = Werte in der zweiten Variablen
Durch die Form der entstehenden Punktewolke können Aussagen über die Art des Zusammenhangs abgeleitet werden.
Ordne zu wann welche Grafik verwendet werden sollte
Zuletzt geändertvor einem Jahr