Mit statistischen Methoden (Berechnung von Lage und Streuungsmaßen, Häufigkeits bzw. Kreuztabellen, Korrelationen und Assoziationsmaßen, graphischen Darstellungen) kann anhand der vorliegenden Werte einer oder mehrerer Variablen eine Gesamtheit von Fällen hinsichtlich der Verteilung des oder der entsprechenden Merkmale beschrieben werden.
Stammen die vorliegenden Daten aus einer Zufallsstichprobe, so können wir aus ihnen Schlüsse auf die Verteilung des oder der Merkmale in der Grundgesamtheit ziehen.
Die Schlüsse gelten aufgrund der Zufälligkeit der Auswahl mit einer genau vorgegebenen oder berechenbaren Wahrscheinlichkeit.
Die beiden zentralen Verfahren des Schließens sind das Schätzen und das Testen.
Population - Zielbevölkerung
Sample - Zufallsauswahl
Merkmalsträger - Beobachtungseinheit
Variable
Wert
dem Namen nach verschieden
eine Rangordnung darstellend, Reihenfolge definiert
Reihenfolge + Abstand definiert
„ein definierter Quotient“ und „ein natürlicher Nullpunkt“
Reihenfolge + Abstand +natürlicher Nullpunkt definiert
„eine absolute Einheit“ Reihenfolge + Abstand + natürl. Nullpunkt + natürl. Einheit definiert
= alle übrige Werte, die ein Vielfaches einer
Grundeinheit sind
= Werte basieren nicht auf einer Maßeinheit
= kein Größenvergleich möglich
= Größenvergleich möglich
(relativ oder
= Zwischen 2 Ausprägungen können eine
beliebige Anzahl weiterer Ausprägungen liegen
= Jeder Wert weist einen definierten Abstand
zu seinem Nachbarn auf -> begrenzt
= Merkmale, die nur zwei mögliche
Ausprägungen aufweisen
= „Maße der zentralen Tendenz einer Verteilung“
Es gibt viele verschiedene Mittelwerte, die eine Verteilung zusammenfassend darstellen sollen. In der Statistik finden vor allem diese drei Mittelwerte Anwendung:
Arithmetisches Mittel
Median
Modus
= Summe aller Messwerte, geteilt durch ihre Anzahl
= Wert, der die nach Größe geordnete Reihe der Messwerte halbiert
1 2 2 3 3 4 5 5 6 z = 3
1 2 2 3 3 4 5 6 z = 3
2 2 2 3 4 5 6 6 z = 3,5
= häufigster Wert einer Verteilung
1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 6, 6, 6, 6
rechtsschief (=linkssteil) -> Pfeile gehen nach links
Modus < Median <arith. MW
linksschief (=rechtssteil) -> Pfeile gehen nach rechts
Modus > Median > arithm. MW
Wenn die Verteilung unimodal ist, also nur einen einzigen „Gipfel“ hat, dann
Modus = Median = arith . MW
• Minimum
• Maximum
• Spannweite (= Max - Min)
• Quartile
• Varianz
• Standardabweichung
Quartile „vierteln“ die geordnete Reihe der Messwerte.
Das 1. Quartil trennt das untere Viertel vom 2. Viertel, das 2.
Quartil ist identisch mit dem Median. Das 3. Quartil trennt das obere Viertel der Messwerte vom Rest.
Der Abstand zwischen dem 1. und 3. Quartil wird auch als
„Quartislabstand”/ “Interquartilsabstand“ bezeichnet. Er umfasst die „mittlere“ Hälfte der Messwerte.
1, 1, 1, I 2, 2, 3, I 3, 3, 4, I 4, 5, 6
Das Prinzip der Quartile kann man natürlich beliebig weiterführen. Vor allem die Aufteilung der nach Größe geordneten Reihe in Abschnitte mit jeweils 1% aller Werte kommen in der Statistik häufig vor. Das sind dann sogenannte Perzentile :
Unter dem 5. Perzentile liegen dann 5 Prozent aller Werte. Über dem 95. Perzentile liegen ebenfalls 5 Prozent aller Werte.
• Gibt die Streuung um den arithmetischen Mittelwert an
• Mittlere quadratische Abweichung vom Erwartungswert
• Erwartungswert = Wert, der bei gleichmäßiger Verteilung
der Zufallsvariable zustande käme
Summe der quadrierten
Abstände der Messwerte
vom arithmetischen Mittelwert,
________________________
dividiert durch die um 1
verminderte Anzahl der Fälle.
• Gebräuchlichstes Streuungsmaß
• Maß für die Streuung der Messwerte um den arithmetischen
Mittelwert
• Standardabweichung = Wurzel aus der Varianz
• Balken-/Säulendiagramme(für nichtmetrische oder selten diskrete Merkmale)
• Histogramme(für stetige metrische Merkmale)
• Kreisdiagramme (für nominalskalierte Merkmale)
• Kastendiagramme/Boxplots
Zuletzt geändertvor 2 Jahren