Deskriptive Statistik
Daten beschreiben, aufbereiten und zusammenfassen mit Hilfe von..
Kennwerten
Tabellen und Abbildungen
Interferenzstatistik
Kennwerte und Analyseergebnisse auf die Population verallgemeinern
Welche Kennwerte/Parameter werden in psychologischen Studien untersucht? (5)
Anteile/ Häufigkeiten
Lagemaße
Streuungsmaße
Unterschiede
Zusammenhänge
Anteile und Häufigkeiten
das Skalenniveau, auf dem Daten gemessen wurden, entscheidet über das Format der Daten und damit über ihre weitere mathematische „Verwertbarkeit“
schon ab Nominalskalenniveau können Anteile und Häufigkeiten bestimmt werden
Beispiele für Nominalskalen: von 50 Probanden sind 20 weiblich
->Frauenanteil = 40%; von 50 Personen bevorzugen (aus Rock, Rap und Klassik) 30 Rockmusik ->60%, 15 Rap->30% und 5 Klassik->10%
Anzahl Personen: Häufigkeit
Prozent Personen: Anteil
Verteilungen von Daten
Personen verteilen sich in ihren Messwerten, Urteilen usw. auf die möglichen Ausprägungen einer Variable
es entstehen Verteilungen von Daten
sie beinhalten die wertvolle Information über die Variabilität von Merkmalen
in Häufigkeitsverteilungen sind die Werte einzelner Personen abgetragen
Häufigkeitsverteilungen konzentrieren sich (meist) bei bestimmten Ausprägungen
man spricht auch von der zentralen Tendenz
man kann daher die „Lage“ von Verteilungen auf der Achse der möglichen Ausprägungen eines Merkmals bestimmen und dafür Lagemaße angeben
je nach Skalenniveau können drei Lagemaße angegeben werden: Modus, Median, Mittelwert
Modus
möglich ab: Nominalskalenniveau (Anordnung der Ausprägungen egal)
das Merkmal bzw. der Wert mit der größten Häufigkeit
Median
sinnvoll ab: Intervallskalenniveau (Anordnung der Ausprägungen nicht egal)
Wie findet man den Median?
alle Werte der Größe nach aufschreiben
der Wert in der Mitte ist der Median
(liegt die Mitte zwischen 2 Werten, ist der Median der Mittelwert dieser beiden)
Median bei 3
Formel Tiefe des Medians
𝑻𝒊𝒆𝒇𝒆 𝑴𝒆𝒅𝒊𝒂𝒏 = 𝑵+𝟏
𝟐
(N = Anzahl der Werte)
Beispiele
bei 11 Werten: Tiefe = 6 (der 6. Wert ist der Median)
bei 10 Werten: Tiefe = 5,5 (der Mittelwert zwischen dem 5. und 6. Wert ist der Median)
Mittelwert
Summe aller Einzelwerte, geteilt durch die Anzahl dieser Werte
sinnvoll ab: Intervallskalenniveau
Nutzung Mittelwert oder Median?
der Mittelwert ist anfällig gegenüber Ausreißern (besonders ungewöhnliche Werte) und schiefen Verteilungen
-> der Median ist robuster und kann daher manchmal sinnvoller sein
Warum sind Lagemaße so wichtig, wenn man sich auch einfach die Häufigkeitsverteilungen der Daten ansehen könnte?
die Lagemaße sollen Verteilungen zusammenfassen und stellvertretend für ihre zentrale Tendenz stehen; sie sind daher auch sparsamer
für weitere Berechnungen steht oft nur der Mittelwert im Fokus (z.B. wenn es um Gruppenunterschiede geht)
Streuungsmaße sind erst ab Intervallskalenniveau sinnvoll
Streuungsmaße werden in der deskriptiven Statistik verwendet, um die Verteilung und die Streubreite von Daten anzugeben.
je nach Form der Verteilung können verschiedene Streuungsmaße bestimmt werden: Spannweite, Interquartilsabstand, Varianz, Standardabweichung
Spannweite
Die Spannweite ist der Abstand zwischen dem kleinsten und dem größten Beobachtungswert.
Zur Berechnung ziehen wir das Minimum eines Datensatzes vom Maximum ab.
𝑹𝒂𝒏𝒈𝒆 = 𝒙𝒎𝒂𝒙 − 𝒙𝒎𝒊𝒏
Interquartilsabstand
Differenz aus dem 75%- und dem 25%-Quartil
wird verwendet um Ausreißer bzw. besonders große/kleine Werte unberücksichtigt
zu lassen
wird oft als Streuungsmaß zusammen mit dem Median angegeben
Wie bestimmt man den Interquartilsabstand (IQA)? -
1. alle Werte der Größe nach aufschreiben -
2. die Zahlenreihe in vier gleich große Abschnitte teilenàQuartile
3. der IA bestimmt sich aus den Werten, die bei 25 und 75 Prozent liegen
Tiefe des Quartils berechnen
1 2 3 4 5 6 7 8 9 10 11
Median: 6
TQ = (Tm (abgerundet) +1) / 2
-> (6+1) / 2 = 3.5
TQ= 3,5
Varianz
Die Varianz gibt an, wie sich deine Beobachtungswerte um den Mittelwert aller Beobachtungen verteilen.
die durchschnittliche quadrierte Abweichung aller Werte von ihrem gemeinsamen Mittelwert
liefert die exakteste Angabe über die Streuung
Beispiel
Standartabweichung
durch das Quadrat lässt sich die Varianz schwer interpretieren
man verwendet daher die Wurzel, die Standardabweichung
Kennwerte und Parameter
Angaben über Stichprobendaten heißen Kennwerte
ihre Symbole stehen in lateinischen Buchstaben
Angaben über Populationswerte heißen Parameter
ihre Symbole stehen in griechischen Buchstaben
Kennwerte und Parameter werden immer kursiv geschrieben!
Streeungsmaße für die Population
Während Lagemaße, die deskriptiv für Stichproben berechnet werden, auch gute Schätzungen für die Population sind, gilt das für Streuungsmaße meist nicht.
Will man einen Kennwerte (aus einer Stichprobe) als Parameter-Schätzung für die Population verwenden, gelten andere Formeln.
-> die Populations-Schätzung wird durch die griechischen Buchstaben ausgedrückt
->manchmal wird auch auf die Schätzung hingewiesen, indem noch ein Dach über das Symbol gesetzt wird: 𝜎3
Texte und Tabellen
wenige deskriptive Daten lassen sich gut im Fließtext beschreiben
liegen mehr Daten vor, bietet sich eine übersichtliche Darstellung in Tabellen an
auch hier werden Lage- und Streuungsmaße angegeben
in Manuskripten werden Tabellen nach APA-Richtlinien formatiert
Zuletzt geändertvor einem Jahr