Warum ist die Statistik als wissenschaftliche Disziplin in nahezu jedem wissenschaftlichen Bereich unerlässlich?
Möchte man hinsichtlich eines bestimmten wissenschaftlichen Bereichs neue Erkenntnisse gewinnen, so ist es in der Regel unerlässlich, Daten mithilfe von statistischen Methoden zu analysieren.
Erläutern Sie anhand eines selbst gewählten Beispiels die Bedeutsamkeit der Statistik.
Möchte man bspw. prognostizieren, wie sich die Inflationsrate zukünftig weiterentwickelt, sollte man zunächst die vergangene Entwicklung betrachten und analysieren, um aus diesen Erkenntnissen Schlussfolgerungen für etwaige zukünftige Entwicklungen ziehen zu können
Erklären Sie allgemein, was man unter einem Merkmalsträger, einem Merkmal sowie einzelnen Merkmalsausprägungen versteht.
Ein Merkmalsträger ist eine Person bzw. ein Objekt, über welches man neue Erkenntnisse erzielen möchte. Das, was man an den Merkmalsträgern erhebt, ist ein Merkmal und die entsprechenden Werte, welche das Merkmal annehmen kann, sind die dazugehörigen Merkmalsausprägungen.
Erläutern Sie anhand eines selbst gewählten Beispiels den Unterschied zwischen der Grundgesamtheit und der Stichprobe.
Möchte man bspw. herausfinden, welchen Lernaufwand deutsche Studierende betreiben, dann stellen alle deutschen Studierenden die Grundgesamtheit dar. Diejenigen Studierenden, welche dann tatsächlich hinsichtlich ihres Lernaufwands untersucht werden, bilden die Stichprobe.
Welches Skalenniveau weisen die folgenden Merkmale auf?
• Geschlecht
• Gewicht
• Postleitzahl
• Lieblingsfarbe
• Schulnoten
• Wohnfläche
• Geschlecht: Nominalskala
• Gewicht: Kardinalskala – Verhältnisskala
• Postleitzahl: Nominalskala (Postleitzahlen sind nur eine Umkodierung von Orten)
• Lieblingsfarbe: Nominalskala
• Schulnoten: Ordinalskala
• Wohnfläche: Kardinalskala – Verhältnisskala
In einer wissenschaftlichen Studie soll ermittelt werden, welcher Unterrichtsstil einzelner Lehrer:innen zu höherem Lernerfolg von Studierenden führt. Ordnen Sie jeweils zu, bei welchem der folgenden Begriffe es sich um den Merkmalsträger, das Merkmal und die Merkmalsausprägung handelt:
• Frontalunterricht,
• Lehrer:in
• Unterrichtsstil.
Ein Merkmalsträger ist eine Person bzw. ein Objekt, über welches man neue Erkenntnisse erzielen möchte (hier also Lehrer:innen). Das, was man an den Merkmalsträgern erhebt, ist ein Merkmal (der Unterrichtsstil) und die entsprechenden Werte, welche das Merkmal annehmen kann, sind die dazugehörigen Merkmalsausprägungen (Frontalunterricht als ein möglicher Unterrichtsstil).
Geben Sie für die folgenden Merkmale an, ob sie diskret oder stetig sind:
• Geschwindigkeit,
• Hörerzahl einer Vorlesung,
• Zeit für die Beschleunigung,
• Anzahl Bücher,
• Stromverbrauch,
• Anzahl der Mitarbeitenden.
• Geschwindigkeit: stetig
• Hörerzahl einer Vorlesung: diskret
• Zeit für die Beschleunigung: stetig
• Anzahl Bücher: diskret
• Stromverbrauch: stetig
• Anzahl der Mitarbeiter: diskret
Geben Sie für die folgenden Merkmale an, welches Skalenniveau sie jeweils aufweisen:
• Nationalität,
• Temperatur,
• Arbeitsamtsbezirk mit der höchsten Arbeitslosenquote,
• Anfangsgehalt von Absolvent:innen der Wirtschaftswissenschaften,
• Fachbereich wissenschaftlicher Hochschulen,
• gemessene Zeit bei einem Sprint,
• Studiendauer
• Nationalität: Nominalskala
• Temperatur: Kardinalskala – Intervallskala
• Arbeitsamtsbezirk mit der höchsten Arbeitslosenquote: Nominalskala
• Anfangsgehalt von Absolventen der Wirtschaftswissenschaften: Kardinalskala – Verhältnisskala
• Fachbereich wissenschaftlicher Hochschulen: Nominalskala
• gemessene Zeit bei einem Sprint: Kardinalskala – Verhältnisskala
• Studiendauer: Kardinalskala – Verhältnisskala
Was ist unter einem natürlichen Nullpunkt zu verstehen?
Ein natürlicher Nullpunkt ist bei verhältnisskalierten Merkmalen vorhanden. Dieser bedeutet, dass die Zahl 0 in allen erdenklichen Einheiten eines Merkmals die gleiche Bedeutung hat. Die Körpergröße in mm, cm oder m hat bspw. einen natürlichen Nullpunkt, denn es gilt: 0 mm = 0 cm = 0 m.
Nennen Sie kurz die drei Schritte statistischer Untersuchungen.
Im ersten Schritt werden die Daten gesammelt. Der zweite Schritt beinhaltet die Datenaufbereitung und im dritten Schritt werden die gesammelten und aufbereiteten Daten ausgewertet.
Angenommen Sie führen ein Interview nach Beendigung eines Fußballspiels durch, um das Spiel gemeinsam mit dem Interviewpartner analysieren zu können, handelt es sich dabei um eine Primär- oder Sekundärerhebung? Begründen Sie Ihre Antwort.
Da das Interview eine neue Datenerhebung beschreibt und nicht auf vorhandene Daten zurückgegriffen wird, handelt es sich um eine Primärerhebung.
Erläutern Sie den Unterschied zwischen der deskriptiven Statistik und der Inferenzstatistik.
In der deskriptiven Statistik werden auf Basis von Stichproben Auswertungen durchgeführt. Diese Ergebnisse gelten nur für die untersuchte Stichprobe. Mithilfe der Inferenzstatistik wird schließlich geprüft, ob sich die Stichprobenergebnisse auf die Grundgesamtheit übertragen lassen.
Warum ist der Schritt der Datenaufbereitung einer der wichtigsten Schritte statistischer Untersuchungen?
Eine saubere Datenaufbereitung ist deswegen unerlässlich, da die dadurch resultierenden Daten Grundlage für die Datenanalyse bilden. Sind die Daten nicht sauber aufbereitet, sind Fehlschlüsse die Folge.
Warum sind Daten im Paneldesign informativer als Daten im Querschnittsdesign?
Wenn Daten im Querschnittsdesign vorliegen, bedeutet das, dass für jeden Merkmalsträger einmalig Daten erhoben werden. Im Kontext des Paneldesigns werden für die einzelnen Merkmalsträger wiederholt Daten erhoben. Man kann demnach durch das Paneldesign die Entwicklung eines Merkmalsträgers über die Zeit hinweg beobachten, während man im Querschnittsdesign den Merkmalsträger nur einmalig berücksichtigt.
Erläutern Sie, warum bei nominalskalierten Merkmalen keine kumulierten Häufigkeiten bestimmt werden, während dies bei mindestens ordinalskalierten Merkmalen der Fall ist.
Während sich die Merkmalsausprägungen nominalskalierter Variablen nicht in eine sinnvolle Reihenfolge bringen lassen, ist dies aber für mindestens ordinalskalierte Variablen möglich. Aus dem Grund lassen sich die Häufigkeiten benachbarter Ausprägungen zusammenfassen.
Erklären Sie, warum bei einem Histogramm Dichten und nicht relative Häufigkeiten abgebildet werden. Wie werden die Dichten berechnet?
Histogramme werden für stetige Merkmale genutzt. Die Merkmalsausprägungen stetiger Merkmale werden in Klassen eingeteilt. Da diese Klassen unterschiedlich breit sein können, würden die relativen Häufigkeiten die Klassen unter Umständen nicht angemessen abbilden können. Aus diesem Grund werden die Dichten gebildet, indem die relativen Häufigkeiten durch die jeweilige Klassenbreite geteilt werden.
In einer Eisdiele wurden an einem Tag die verkauften Kugeln Eis pro Kund:in gezählt. Dabei ergaben sich für die 20 Kund:innen die folgenden Werte: 1, 3,2, 3,2,1,1,2,2,4,3,2,1,3,2,3,3,3,4,1. Erstellen Sie für den Eiskonsum die vollständige Häufigkeitstabelle.
Insgesamt 40 Personen wurden hinsichtlich ihres Alters befragt. Da es relativ viele verschiedene Antworten gab, wurde das Alter in sechs unterschiedlich breite Klassen eingeteilt. Anschließend wurde gezählt, wie viele Personen in die jeweiligen Klassen einsortiert werden können:
Eine Grundschullehrerin korrigiert die Diktate von 15 Schüler:innen und stellt folgende Fehlerzahlen fest: 1, 2,2, 3,4,5,4,4,3,5,3,8,4,1,6. Ermitteln Sie den Modus, Median und den Mittelwert.
Ausführliche Lösung Sortierter Datensatz: 1,1,2,2,3,3,3,4,4,4,4,5,5,6,8
In einer Eisdiele wurden an einem Tag die verkauften Kugeln Eis pro Kund:in gezählt. Dabei ergaben sich für die 20 Kund:innen die folgenden Werte: 1, 3,2, 3,2,1,1,2,2,4,3,2,1,3,2,3,3,3,4,1. Berechnen Sie den Modus, den Median und den Mittelwert. Interpretieren Sie Ihre Ergebnisse.
In einer Eisdiele wurden an einem Tag die verkauften Kugeln Eis pro Kund:in gezählt. Dabei ergab sich folgende Häufigkeitstabelle:
Warum ist der Interquartilsabstand als Maßzahl für die Streuung besser geeignet als die Spannweite?
Die Spannweite berücksichtigt die kleinste und größte Beobachtung. Diese können unter Umständen Ausreißer sein, wodurch die Spannweite sehr groß wird und evtl. damit zu Unrecht eine große Streuung widerspiegelt. Der Interquartilsabstand konzentriert sich auf die zentralen 50 % an Beobachtungen und vernachlässigt damit etwaige Ausreißer. Aus dem Grund ist sie besser geeignet als die Spannweite.
In einer Eisdiele wurden an einem Tag die verkauften Kugeln Eis pro Kund:in gezählt. Dabei ergaben sich für die 20 Käufer:innen die folgenden Werte: 1, 3,2, 3,2,1,1,2,2,4,3,2,1,3,2,3,3,3,4,1. Berechnen Sie die Spannweite, den Interquartilsabstand und die Standardabweichung.
Sortierter Datensatz: 1, 1, 1, 1, 𝟏,𝟐,2,2,2,2,2,3,3,3, 𝟑,𝟑,3,3,4,4
Spannweite: 𝑅 = 4−1 = 3.
Spannweite: 𝑅 = 4−1 = 3 (Ausprägung in der letzten Zeile – Ausprägung in der ersten Zeile).
Interquartilsabstandunteres Quartil:
𝑥0.25 = 2 (2, da erst in der zweiten Zeile die 0,25 das erste Mal überschritten wird)
oberes Quartil: 𝑥0.75 = 3
I𝑄𝑅 = 3−2=1 Anders als bei Frage 26 ergibt sich hier ein IQR in Höhe von 1. Dies liegt am unteren Quartil, welches auf Basis der Häufigkeitstabelle einen anderen Wert ergab. Dies kann durchaus passieren.
In Frage 26 lag folgende Ausgangssituation vor: In einer Eisdiele wurden an einem Tag die verkauften Kugeln Eis pro Kund:in gezählt. Dabei ergaben sich für die 20 Käufer:innen die folgenden Werte: 1,3,2,3,2,1,1,2,2,4,3,2,1,3,2,3,3,3,4,1.
Sie haben dafür die Spannweite, den Interquartilsabstand und die Standardabweichung berechnet. Wie verändern sich die Spannweite, der Interquartilsabstand und die Standardabweichung, wenn in Frage 26 alle Kund:innen doppelt so viele Kugeln Eis kaufen? Eine ausführliche Rechnung ist nicht nötig.
Die Spannweite verdoppelt sich. Der kleinste Wert ist nun 2 und der größte 8. Die Differenz dieser beiden ist 6 (vorher 3). Der Interquartilsabstand verdoppelt sich ebenfalls. Die beiden Quartile werden zu 3 bzw. 6, wodurch der IQR bei 3 liegt (vorher 1,5). Auch die Standardabweichung verdoppelt sich, wenn sich alle Werte verdoppeln.
Zuletzt geändertvor 12 Tagen