Nennen Sie die Aufgaben der deskriptiven Statistik!
Darstellung von Daten, zB in tabellarischer Form
Beschreibung von Datenverteilungen anhand von Kennwerten
Beschreibung von Zusammenhängen zweier Variablen (Assoziations-/Korrelationsmaße)
Zusammenfassung zu Klassen (Cluster) und Reduktion mehrerer Variablen auf wenige Faktoren
Schätzungen/Prognosen einer abhängigen Variablen durch eine/mehrere unabhängige Variablen
Erläutern Sie das Schema bei univariaten Analysen!
Klassifizierung und Kategorisierung in Häufigkeitstabellen
grafische Präsentation in Diagrammen
numerische Beschreibung anhand statistischer Kennwerte
Geben Sie allgemeine Anforderungen der grafischen Darstellung von Daten an!
aussagekräftig
übersichtlich, einfach und verständlich
muss dem Wahrheitsgehalt entsprechen
Wann eignet sich das Kreisdiagramm (“pie chart”) zur Darstellung von Daten?
nur bei wenigen Ausprägungen sowie bei Ausprägungen, deren relative Häufigkeiten sich klar unterscheiden lassen
nur für nominale, u.U. für ordinale Daten
in Wissenschaft selten
Wann eignet sich das Balken-/Stabdiagramm (“bar chart”) zur Darstellung von Daten?
zur Darstellung von nominalen und ordinalen Daten sehr gut geeignet
Reihenfolge bei ordinalen Daten darf nicht verändert werden
Wann eignet sich das Histogramm zur Darstellung von Daten?
ausschließlich bei metrischen Daten
stellen Wertebereiche dar
X-Achse: Intervalle
für jedes Intervall wird die Höhe der Balken berechnet
=> Intervalle müssen gleich breit sein
Nennen und erläutern Sie die Kennwerte zur zentralen Tendenz!
Modus (“mode”)
Messwert mit größter Häufigkeit
in allen Skalenniveaus erlaubt
Median
Messwert bzw. Kategorie, der die Menge der gereihten Messwerte in zwei Hälften teilt
Vorteil: wird durch “Ausreißer” wenig beeinflusst
Einsatz ab ordinalem Niveau
Berechnung:
ungerades n: Messwert in der Mitte
gerades n: Mittel zwischen den beiden Werten in der Mitte
arithmetisches Mittel (“mean”)
gängiger und am häufigsten angewendeter Kennwert zur zentralen Tendenz
Berechnung: Summe der Messwerte / Anzahl Messwerte
potentielle Anfälligkeit ggü. Ausreißern bzw der Verteilung der Daten
Einsatz ab metrischem Niveau
Nennen und erläutern Sie die Kennwerte zur Dispersion!
Minimum & Maximum: kleinster und größter beobachteter Messwert
ab Ordinalskalenniveau
Spannweite (“range”): Abstand zwischen Minimum und Maximum
ab Ordinalskalenniveau zulässig, sinnvoll erst bei metrischen Skalenniveaus
Quartile/Interquartilbereich
erst Reihung der Messwerte, dann Einteilung in vier gleich große Gruppen (Quartile)
“Perzentile”= Überbegriff für beliebige prozentuale Einteilung
Interquartilbereich: Bereich, in dem sich die mittleren 50% der Messwerte befinden
Varianz (“variance”)
ab metrischem Niveau
Varianz s²
durchschnittliche bzw. mittlere quadrierte Abweichung vom Mittelwert
Standardabweichung (“standard deviation”)
bezieht sich auf die Einheit der Variablen (zB Lebensjahre)
exakte Aussage über die Streuung lässt sich immer nur im Vergleich zu anderen Verteilungskennwerten treffen
Vorsicht: s ist NICHT die durchschnittliche Abweichung der Messwerte vom Mittelwert, sondern die Wurzel aus der durchschnittlichen quadrierten Abweichung!
Nennen Sie die Formel der Varianz!
Zuletzt geändertvor einem Monat