nominal
dem Namen nach
ordinal
Sortierung von Variablen in eine Randordnung, je nach Ausprägung
Intervall
zeitlicher Zwischenraum
metrisch
numerische Werte, die intervallskaliert (Abstand zwischen Werten)
Korrelation
statistisches Maß, das ausdrückt, inwieweit zwei Variablen in einer linearen Beziehung zueinander stehen
Merkmalsträger
= Analyseeinheit (Einheit gemäß der Fragestellung)
Merkmale
= Daten
Quantile
Merkmale von Teilen der Daten
Datenvisualisierung
Verteilung aller Beobachtungen
Dezile
10 Abschnitte decken je 10% ab
Terzile
3 Abschnitte je 33,33%
Quintile
5 Abschnitte je 20%
Perzentile
100 Abschnitte je 1%
Was ist eine Lagemaße und was wird ihr zugeordnet?
= Maße zentraler Tendenz
Modus
Median
Mittelwert
Was gehört zu der Streuungsmaße?
Reichweite
Varianz
Standardabweichung
Variation (skoeffizient)
Schiefe
Kurtosis
Was ist die empirische Varianz?
= mittlere quadrierte Abweichung vom Mittelwert
Was ist due empirische Standardabweichung?
= mittlere Abweichung vom Mittelwert
Was ist ein relatives Streuungsmaß?
= eine Kennzahl, die nicht von der Maßeinheit der statistischen Variable bzw. Zufallsvariablen abhängt
Was bedeutet Schiefe?
= Grad der Symmetrie einer Verteilung
(Annahme: unimodale Verteilung)
0 => Normalverteilung
>0 => rechtsschief
<0 => linksschief
Was bedeutet Kurtosis?
= Weite und Wölbung im Vergleich zu einer Normalverteilung
3 => Normalverteilung
>3 => spitzer als Normalverteilung
<3 => flacher als Normalverteilung
Was ist die Grundgesamtheit (Population)?
= alle Analyseeineheiten, die theoretisch oder inhaltlich von Interesse sind (Zielpopulation)
muss von Forschendem definiert werden
Was ist eine Stichprobe?
= Teilmenge einer Grundgesamtheit
In Abhängigkeit von Erhebungsmethode gibt es verschiedene Stichprobenarten (Zufallstichprobe, Klumpenstichprobe, etc.)
Was ist statistisches Schließen?
= Schluss von einer Stichprobe auf die Grundgesamtheit
Was ist nichtschließende Statistik?
= Berechnung des interessierenden Wertes
Was ist schließende Statistik?
= Berechnung des interessierenden Wertes + Inferenzstatistik
Was ist Frequentismus?
-> wie häufig ist ein (berechneter oder möglicher) Stichprobenwert im Vergleich zu anderen Stichprobenwerten?
zentraler Grenmzwertsatz
Die Kennwerteverteilung ist unabhängig von der Verteilung in der Grundgesamtheit normalverteilt.
Was ist ein Standardfehler?
= Standardabweichung der Kennwerteverteilung
Was ist der empirische p-Wert?
misst, ob der beobachte Unterschied zwischen zwei Gruppen statistisch signifikant ist
Was sind die Ziele des Schließens?
testen
schätzen
Von was hängt der p-Wert als Maß für Extremheit ab?
Lage der Kennwerteverteilung
Stichprobenwert
Standardfehler
Was ist eine Variablenstandardisierung?
= Transformation einer Variblen auf ein Maß, das Vergleichbarkeit herstellt
Was sind Daten?
= Informationen über die zu untersuchenden sozialen Tatbestände
Was ist eine Variable?
= Merkmals- bzw. Eigenschaftsdimension, die mit einem begriff bezeichnet und mehrere Ausprägungen annehmen kann
Was ist eine Skala?
= Regel zur Zuordnung von numerischen zu empirischen Relationen
Was ist die statistische Signifikanz?
= Kennwert liegt im Randbereich der Kennwerteverteilung
Was ist die statistische Nichtsignifikanz?
= Kennwert liegt zwischen den Randbereichen der Kennwerteverteilung
Was ist der Unterschied zwischen z-Wert und t-Wert?
die jeweiligen kritischen Bereiche haben unterschiedliche Werte
Was ist die Bedeutung von alpha?
Größe des kritischen Bereichs
Möglichkeit, die Nullhypothese abzulehnen
Wahrscheinlichkeit, einen Fehlschluss zu begehen
Worauf verweist das Rauschen?
Nichtsignifikanz
Worauf verweist das Signal?
statistische Signifikanz
je größer die Power, desto höher die Chancen, in einer Analyse statistische Signifikanz zu erzielen
je kleiner der Standardfehler, desto höher die Chancen, statistische Signifikanz zu erzielen
je größer die Differnez zwischen den Werten von H(0) und H(A), desto höher die Power und die Chancen, statistische Signifikanz zu erzielen
Was hat die Kennwertverteilung beim Testen und Schätzen?
unterschiedliche Lage
gleiche Form und Streuung
je weiter das Intervall, desto unpräziser die Schätzung und dest größer die Unsicherheit über den Populationswert
Präzision der Schätzung:
weites Intervall: geringe Genauigkeit
enges Intervall: hohe Genauigkeit
Eine Studie untersucht, ob in der wahren Bevölkerung der Anteil von Frauen und Männern, die die SPD wählen, gleich ist. Es werden aus der Wahlbevölkerung zwei Stichproben mit je 500 Frauen und Männer gezogen. Sie lesen in der Studie, die Nullhypothese sei, dass der Unterschied zwischen den Anteilen 0 ist. Wie ist diese Nullhypothese genau zu verstehen? Es wird davon ausgegangen, dass…
Sie führen einen ein Stichproben Signifikanztest für den Populationsmittelwert durch. Die Populationsvarianz ist unbekannt und muss geschätzt werden. Die Stichprobengröße beträgt 53. Sie entscheiden sich aufgrund der Daumenregel, dass man ab 30 Beobachtung einen z-Test durchführen darf, für einen z-Test. Die kritischen z-Werte für den zweiseitigen Nullhypothesentest mit einem Alpha von 0,05 sind -1,96 und 1,96. Sie halten für den Stichprobenmittelwert ein z-Wert von 1,9. Stellen Sie sich nun vor, sie hätten einen Test statt eines z-Test durchgeführt. Was wäre bei einem t-Test die Schlussfolgerung für die Nullhypothese?
Sie führen einen Zweistichproben t-Test durch. Die erste Stichprobe enthält Daten über die Zeit, die Frauen mit Hausarbeit verbringen. Die zweite Stichprobe enthält Daten über die Zeit, die Männer im Haushalt verbringen. Die Nullhypothese ist, dass Frauen im Schnitt 2 Stunden mehr für den Haushalt aufwenden. Ein linksseitige t-Test mit einem Alpha von 0,05 ergibt ein p-Wert von 0,39. Wie ist der p-Wert zu interpretieren?
p-Wert als Maß für Extremheit hängt von … ab:
Kann für die in Abbildung 1 dargestellten Daten ein Median berechnet werden?
Was ist der Medianwert der Familienmitglieder?
In einem Fragebogen wird die Zeit abgefragt, die Personen ta ̈glich fu ̈r Hausarbeit aufwenden. Wenn gem ̈aß der Daten das dritte Quartil 45 Minuten, dann ist der Quantilswert für das 60-ste Perzentil..
Sie lesen eine quantitative Studie, die ausschließlich folgendes Forschungsziel aufstellt: “Wir berechnen für unsere Daten den Mittelwert und die Standardabweichung. Welches Erkenntnissinteresse hat diese Studie?
Sie sollen, dass 90 % Konfindenzintervall für Stichprobenmittelwert interpretieren. Welche der folgenden Aussagen interpretiert das Konfidenzintervall richtig?
Sie führen einen Einstichproben Signifikanztest für den Populationsmittelwert durch. Die Populationsvarianz ist unbekannt und muss geschätzt werden. Die Stichprobengröße beträgt 53. Sie entscheiden sich aufgrund der Daumen Regel, dass man ab 30 Beobachtung ein Z Test durchführen darf, Für ein Z Test. Die kritischen z-Werte für den zweiseitigen null Hypothesen Test mit einem Alpha von 0,05 sind -1,96 und 1,96. Sie enthalten für den Stichprobenmittelwert ein Setwert von 1,9.0 Hypothese wird nicht verworfen. Stellen Sie sich nun vor, sie hätten ein t-test statt eines z-Test durchgeführt. Wie wäre es am t-Test die Schlussfolgerung für die Nullhypothese?
Sie verwenden einen z-Test und z-Verteilung, um in zwei Studien die Nullhypothese zu testen, dass von allen Elternteilen, die unterhaltspflichtig sind, 30% (Anteil = 0,3) den Unterhalt nicht leisten. Die erste Studie hat ein Stichprobengröße von 20; die zweite Studie hat eine Stichprobengröße von 400. Wie verhalten sich die beiden z-Verteilungen zueinander, die für den Nullhypothesentest herangezogen werden?
Zwei Forschungsteams arbeiten mit unterschiedlichen Stichproben aus TikTok-Nutzern an der Frage, ob politische Desinformation das Vertrauen in die Politik untergräbt. Die statistisch relevante Größe ist der Stichprobenmittelwert des Vertrauens in die Politik.
Das erste Team führt mit seiner Stichprobe einen Minimaltest (Minimaldifferenztest) durch, das zweite Team mit seiner Stichprobe einen Äquivalenztest. Das erste Team akzeptiert die Nullhypothese, das zweite Team verwirft die Nullhypothese. Wie verhalten sich die Schlussfolgerungen zueinander?
Sie berechnen für eine Stichprobe von 300 Befragten die Pearsonkorrelation zwischen Alter und dem Geldbetrag, der für die Altersvorsorge angelegt ist. Sie berechnen ein Pearsonsches r von 0,3, mit einem 90%-Konfidenzintervall von 0,12 bis 0,48. wie ist das r zu interpretieren?
Mit welcher der folgenden Verteilungen kann man die Nullhypothese nur rechtsseitig testen?
Sie schätzen eine bivariate OLS-Regressionsgleichung mit einem R-Quadrat von 0,2. Wie ist das R-Quadrat zu interpretieren?
Für drei Parteien liegen Ihnen Daten vor über die Anzahl der Mitglieder, die zufrieden mit der Arbeit der Regierung sind und die Anzahl der Mitglieder, die unzufrieden sind. Daraus ergibt sich eine Kreuztabelle mit 2×3 Zellen. Ein chi² Quadrat hat ergibt, dass der P Wert für die Häufigkeiten in der Tabelle statistisch significant des (p kleiner als 0,01). Was ist die konkret, was die korrekte Interpretation dieses Ergebnisses?
Zur Berechnung des Powerniveaus für einen Zweistichproben Binomialtest gehen Sie davon aus, die Anteilsdifferenz in den Grundgesamtheiten 0,2 Punkte beträgt. Die Nullhypothese geht von einer Differenz von 0 aus. Unter der Annahme, dass Sie zweiseitig testen mit einem Alpha von 0,05, so erhalten Sie ein Powerniveau von 0,39. Was ist die korrekte Interpretation des Powerniveau von 0,39?
Sie schätzen eine bivariate OLS-Regressionsgleichung mit einem R-Quadrat von 0,2.
Wie ist das R-Quadrat zu interpretieren?
In einer Studie vergleichen Sie die täglichen Mittelwerte der Social media Nutzung von Kindern in der Grundschule (Klassen 1 bis 4, Stichprobe 1) und Kindern in der fünften und sechsten Klasse (Stichprobe 2).
Sie wissen, dass sie in den Stichproben mindestens jeweils 250 Kinder haben werden (n1 = n2 = 250).
Sie wollen in dem Zweistichproben t-Test mindestens ein Mittelwert unterschied von 1 Stunde mit einem Powerniveau von 0,8 erfassen können.
Vor der Untersuchung führen Sie eine Poweranalyse durch und finden heraus, dass für die Stichprobengrößen n1 = n2 = 250 und ein Mittelwert unterschied von 1 Stunde das Powerniveau bei 0,92 liegt.
Wie kann man diese Zahl interpretieren im Vergleich zum angestrebten Mindestpowerniveau von 0,8?
In einer bivariaten Regressionsanalyse untersuchen Sie den Effekt der Dauer der Arbeitslosigkeit auf die Gesundheit. Die Dauer der Arbeitslosigkeit wird in Monaten gemessen. Die variablen als Maß für Gesundheit kann als metrisch angesehen werden. Der geschätzte marginale Effekt beträgt -0,23.
Wie ist der marginale Effekt zu interpretieren?
Sie führen einen, Zweistichproben t-test durch.
Die erste Stichprobe enthält Daten über die Zeit, die Frauen mit Hausarbeit verbringen; die zweite Stichprobe enthält Daten über die Zeit, die Männer im Haushalt verbringen.
Die null Hypothese ist, dass Frauen im Schnitt 2 Stunden mehr für den Haushalt aufwenden. Ein linksseitiger t-Test mit einem Alpha von 0,05 ergibt ein p-Wert von 0,39.
Wie ist der p-Wert zu interpretieren?
Für eine Studie über den Erfolg von fünf verschiedenen Podcasts liegen in Daten über die durchschnittliche Zahl der Hörerenden je Woche vor.
Sie testen die Standardnullhypothese mit einer Analysis of Variance (ANOVA), um zu ermitteln, wie sich der Erfolg der Podcast zueinander verhält. Das Ergebnis ist, dass die Nullhypothese auf einem Signifikanzniveau von 10 % verworfen werden kann.
Wie ist dieses Ergebnis zu interpretieren?
Sie sollen, dass 90 % Konfidenzintervall für Stichprobenmittelwert interpretieren.
Welche der folgenden Aussagen interpretiert das Konfidenzintervall richtig?
Ein chi2-Quadrat Test ergibt, dass der p-Wert für die Häufigkeiten in der Tabelle statistisch signifikant ist (p < 0,01).
Was ist die korrekte Interpretation dieses Ergebnisses?
Mit welcher der folgenden Verteilung kann man die neue Prothese nur rechtzeitig testen?
Sie betrachten eine Studie, die eine Nullhypothese mit fünf verschiedenen Stichproben testet.
Es liegt also ein Fall von multiplem Testen vor. Für jeden einzelnen Test beträgt der Fehler 1. Art 0,05.
Wie verhält sich die testbezogene Fehlerwahrscheinlichkeit (TWER) von 0,05 zur family-wise error rate (FWER) für die fünf Tests zusammengenommen?
In der beschreibenden und nichtschließenden Statistik wird die empirische Varianz berechnet. In der beschreibenden und schließenden Statistik verwendet man einfach die Varianz (ohne weiteres Adjektiv).
Wenn sie dieselben Daten verwenden, um die empirische Varianz und die Varianz zu berechnen, wie verhalten sich diese zueinander?
Sie führen einen Einstichproben Signifikanztest für den Populationsmittelwert durch. Die Populationsvarianz ist unbekannt und muss geschätzt werden. Die Stichprobengröße beträgt 53.
Sie entscheiden sich aufgrund der Daumenregel, dass man ab 30 Beobachtungen einen z-Test durchführen darf, für einen z-Test.
Die kritischen z-Werte für den zweiseitigen Nullhypothesentest mit einem Alpha von 0,05 sind -1,96 und 1,96.
Sie erhalten für den Stichprobenmittelwert einen z-Wert von 1,9. Die Nullhypothese wird nicht verworfen.
Stellen Sie sich nun vor, Sie hatten ein t-Test statt eines z-Tests durchgeführt.
Was wäre bei einem t-Test die Schlussfolgerung über die NUllhypothese?
Welche der folgenden Eigenschaften hat ein OLS-Schätzer nicht zwangsläufig, wenn die Annahmen für eine OLS-Schätzung erfüllt sind?
Für eine statistische Analyse des Populationsmittelwertes wurde die Populationsstandardabweichung mit 2 geschätzt. Die Stichprobengröße der Analyse beträgt 16.
In einer zweiten Analyse wollen Sie einen Standardfehler, der nur einem Viertel des Standardfehlers der ersten Studie entspricht.
Um welchen Faktor muss die Stichprobe in der zweiten Studie größer sein als in der ersten Stichprobe? (Die Populationsstandardabweichung beträgt nach wie vor 2)
Ein Boxplot der Anzahl der elektronischen Geräte in 1000 Haushalten zeigt, dass die Differenz zwischen erstem und zweitem Quartil so groß ist wie die Differenz zwischen zweitem und drittem Quartil
Was bedeutet das für den Modus?
Bei einem Nullhypothesentest für eine Mittelwertdifferenz testen Sie rechtsseitig auf statistische Signifikanz mit einer t-Verteilung. Sie erhalten als t-Wert für die Differenz den Wert von 0.
Wie groß ist der p-Wert für den Signifikanztest?
In Bezug auf die Variable “Familienstand” mit den Ausprägungen “ledig, verheiratet, verwitwet, geschieden, getrennt lebend”
Welche statistische Berechnung ist für diese Variable zulässig?
Sie haben Daten über das Einkommen von Personen vorliegen, die auf den Euro genau gemessen sind und verhältnisskaliert sind. Wenn Sie für diese variable die Varianz und die Standardabweichung berechnen, wie verhalten sich diese dann zueinander?
Welche dieser Aussagen trifft nicht zu?
Die Variable “Parteiensystem” weist folgende Ausprägungen auf: Einparteien - Zweiparteien- und Mehrparteiensystem. Welches Skalenniveau liegt hier vor?
In der beschreibenden und nichtschließenden Statistik wird die empirische Varianz berechnet. In der beschreibenden und schließenden Statistik verwendet man einfach die Varianz (ohne weiteres Adjektiv). Wenn Sie dieselben Daten verwenden, um die empirische Varianz und die Varianz zu berechnen, wie verhalten sich diese zueinander?
Betrachten Sie die beiden Verteilungen in der folgenden Abbildung. Beides sind t-Verteilungen. Welche dieser Kurven hat die höheren Freiheitsgrade?
Ein Freund fragt Sie um statistischen Rat. Ihr Freund möchte eine geringe Wahrscheinlichkeit, den Fehler erster Art zu begehen und fragt Sie, wie man das erreichen kann. Was würden Sie raten?
Ihr Freund berichtet, dass sie in der Studie, die er durchführen möchte, ein Niveau der Power von 0,86 hat. Wie kann man dies interpretieren?
Sie führen einen Zweistichproben t-Test durch. Die erste Stichprobe enthält Daten über die Zeit, die Frauen mit Kinderbetreuung verbringen; die zweite Stichprobe enthält Daten über die Zeit, die Männer mit Kinderbetreuung verbringen. Die neue Prothese ist, dass Frauen im Schnitt 2 Stunden mehr für die Kinderbetreuung aufwenden. Ein linksseitiger t-Test mit einem Alpha von 0,05 ergibt einen p-Wert von 0,02.
Sie sollen das 95% Konfidenzintervall für Stichprobenmittelwerte interpretieren. Welche der folgenden Aussagen interpretiert das Konfidenzintervall richtig?
Sie berechnen für eine Stichprobe von 1000 Befragten den Zusammenhang zwischen Nationalstolz und Autoritarismus. Sie berechnen ein Pearsinsches r von 0,54 mit einem symmetrischen 95%-Konfidenzintervall von 0,32 bis 0,67. Was kann man aus dem Konfidenzintervall schlussfolgern?
Es wird untersucht, wie viele Minuten erwachsener täglich politische Podcasts hören. Die Stichprobe besteht aus 532 Erwachsenen, die zu ihrem täglichen Podcast Konsum befragt worden. Die Nullhypothese ist, dass erwachsene täglich durchschnittlich 60 Minuten politische Podcasts hören. Es wird ein Einstichproben t-Test durchgeführt. Der t-Wert für die in der Stichprobe gemessene durchschnittliche Zeit, die Politische Podcast gehört werden, ist 1,65. Was können Sie daraus schließen? Über die durchschnittliche Anzahl der Minuten, die, die in der Stichprobe erfassten Befragten politische Podcasts hören?
Ihr Freund berichtet, dass sie in der Studie, die er durchführen möchte, ein Niveau der Power von 0,74 hat. Wie kann man dies interpretieren?
Zur Berechnung des Powerniveaus für einen Zweistichproben Binomialtest gehen Sie davon aus, die Anteilsdifferenz in den Grundgesamtheiten 0,4 Punkte beträgt. Die Nullhypothese geht von einer Differenz von 0 aus. Unter der Annahme, dass Sie zweiseitig testen mit einem ALpha von 0,05, so erhalten Sie ein Powerniveau von 0,51. Was ist die korrekte Interpretation des Powerniveaus von 0,51?
Ihre Freundin möchte in einer Studie den Fehler zweiter Art klein halten. Wovon würden Sie ihrer Freundin abraten?
Für eine Studie über den Erfolg von Streaming Serien vergleichen. Sie drei Arten von Anbietern: Netflix, Amazon Prime und Apple plus. Sie haben Daten vorliegen über die Zuschauerzahl für Serien, die von den drei Firmen jeweils selber produziert wurden. Sie führen eine ANOVA durch, und so ein Mädchen ab sich die durchschnittliche Zuschauerzahl für die Eigenproduktionen zwischen den drei Anbietern unterscheidet. Ihr Ergebnis ist, dass die Standardnullhypothese einer ANOVA verworfen werden kann, weil der F-Wert statistisch signifikant ist. Was bedeutet dies inhaltlich?
Welcher der folgenden Pearsonschen Korrelationskoeffizienten, r, ist nicht durch eine Abbildung dargestellt?
Last changed20 hours ago