Was gibt der Standardfehler im Bzg. auf Konfidenzintervalle an?
Wie repräsentativ eine Stichprobe für eine Population ist
Was sind kleine bzw. große Standardfehler?
Großer standardfehler: zeigt an, dass die Mittelwerte verschiedener Stichproben stark variieren & daher diesee Stichprobe die Population nicht gut wiederspiegelt
Kleiner Standardfehler: bedeutet, dass die meisten Stichprobenmittelwerte ähnlich dem Populationsmittelwert sind und die gegebene Stichprobe eine genaus Abbildung der Grundgesamtheit darstellt
Was ist der Mittelwert im bzg. auf Konfidenzintervalle
= ein erwartungstreuer Schätzer des meist unbkannten Populationsmittelwertes
Konfidenzkoeffizient
= Wahrscheinlichkeit, dass Konfidenzintervall den wahren Parameter der Population enthält (üblicherweise mit 95% oder 99% festgelegt)
Konfidenzintervall (KI)
Bereiche in denen sich Populationsparameter befinden, die als Erzeuger eines empirisch bestimmten Stichprobrnkennwertes mit einer bestimmten Wahrscheinlichkeit in Frage kommen.
Wie nennt man die Restwahrscheinlichkeit (außerhalb Konfidenzintervall)
Alpha, Konfidenzniveau, Signifikanzniveau
Was ist der kritische Wert
Der Wert, der sich an der Stelle befindet, wo die Grenzen des Konfidenzintervall über- oder unterschritten werden.
Wovon ist das KI abhängig?
Stichprobenumfang -> Je größer die Stichprobe, desto kleiner das Konfidenzintervall
Wahl des alpha -> je größer 1-α (Konfidenzkoeffizient), desto größer das KI
Was passiert bei kleinen Stichproben (n<30)
Die Verteilung der am geschätzten Standardfehler relativierten Differenz folgt einer t-Verteilung
Von wem wurde die studentsche t- Verteilung entwickelt ?
William Saely Gosset
Die standardisierte Schätzfunktion des Stichprobenmittelwertes (Berechnung des Mittelwerts basierend auf den vorliegenden Stichprobendaten) normalverteilter Daten, ist nicht mehr normalverteilt, sondern t-verteilt, wenn
die zur standardisierung des Mittelwerts benötigte Varainz des Merkmal unbekannt ist
mit der Stichprobenvarianz geschätzt werden muss
Wie nennt man Hypothesentests bei denen die t-Verteilung verwendet wird?
t-Tests
Welche Berechnung erlaubt die t-Verteilung?
Berechnung der Verteilung der Differenz vom Mittelwert der Stichprobe zum wahren Mittelwert der Grundgesamtheit
t-Verteilungen zeigen für kleine Werte des Parameters n…
… eine größere Breite und Flankenbetonung als Normalverteilungen
Je größer die Freiheitsgrade, desto …
… näher kommt sie an die Normalverteilung
… mehr Informationen vorhanden (größere Stichprobe, mehr Aufschluss über Grundgesamtheit
Nullhypothese
= die im Rahmen einer Hypothesenprüfung zu testende Annahme über die Grundgesamtheit
-> es wird häufig die Annahme gewählt, die man wiederlegen möchte
-> Die Nullhypothes (H0) beinhaltet immer die Gleichheit von Sachverhalten
Arbeits- oder Alternativhypothese (H1, HA)
= durch Beobachtung oder Überlegungen begründete Annahme/Vermutung, die zu Erklärung bestimmter Phänomene dient
-> Die Alternativhypothese beinhaltet immer eine ungeleichheit von Sachverhalten
Wie stehen H0 und HA zueinander?
Arbeitshypothese steht einer verbreiteten Annahme oder Vermutung (H0) entgenen
H0 und HA dürfen sich nicht überschneiden (müssen disjunkt) sein
Was ist das Ziel eines statistischen Tests
= Ablehnung der Nullhypothese
-> Wenn diese nicht verworfen werden kann,besteht aus statistischer Sicht, kein Grund, von der Gültigkeit der Nullhypothese auszugehen
-> Ein statistischer test kann also ledoglich zu einer Annahme der Alternativhypothese, nicht aber zur Annahme der Nullhypotheseführen
Varianten von Hypothesen
Ungerichtete Hypothes (unterscheidet lediglich Unterschied zwischen vgl. Kennwerten)
Gerichtete Hypothese (unterstellt einen Unterschied zwischen den untersuchten Kennwerten in bestm. Richtung)
Spezifische Hypothese (macht Aussage über die Größe des erwarteten Unterschieds d. untersuchten Kennwerte)
5 Schritte des Testens von Hypothesen
Formulierung H0 & HA
Spezifikation der Stichprobenkennwertverteilung (z.B. Mittelwert, t-Wert, z-Wert, Korrealtionskoeffizient …)
Spezifikation des Signifikanzniveaus & des kritischen Wertes
Berechnung der Testgröße (test statistic)
Selektion der passenden Hypothese
Veranschaulichung der Hypothesenprüfung
Richtung des Testens
Je nachdem ob die hypothese gerichtet oder ungerichtet ist, unterscheidet man zwischen einseitigen und zweiseitigen testen.
Einseitige Tests
-> Gerichtete Hypothesen können mit einseitigem Test überprüft werden
Bsp: Bei einseitigem Testen (95% Niveau) sucht man in der z-Tabelle den Wert unter dem 95% der Fläche liegen
Zweiseitiges Testen
-> Ungerichtete Hypothesen müssen mit einem zweiseitigen Test überprüft werden
Bsp: Bei zweiseitigem Testen (95% Niveau) sucht man in der z-Tabelle nach dem Wert unter dem 2,5% der Fläche liegen (auf jeder seite 2,5%)
Fehler beim Hypothesen testen
Fehler 1. Art (α - Fehler)
Fehler 2. Art (ß - Fehler)
Ablehnen der an sich richtigen Nullhypothese
Bzw. Annehmen der falschen Alternativhypothese
Wahrscheinlichkeit dafür ist α
Ablehnen der an sich richtigen Arbeitshypothese
Bzw. Annehmen der falschen Nullhypothese
Wahrscheinlichkeit dafür ist ß
Eigenschaften der Fehleraten beim Hypothesentesten
Signifikanzniveau α
Standardabweichung σ in der Grundgesamtheit
Stichprobengröße
Wert des Parameters in der Grundgesamtheit
Eigenschaften der Fehleraten beim Hypothesentesten - Signifikanzniveau α
ß wird größer, wenn α kleiner wird
α und ß hängen zusammen
Es ist nicht möglich, beide Fehler gleichzeitig zu verringern
Eigenschaften der Fehleraten beim Hypothesentesten - Standardabweichung σ in der Grundgesamtheit
ß wird größer, wenn σ größr wird
Die Unischerheit in der Srtichprobe wird größer
Eigenschaften der Fehleraten beim Hypothesentesten - Stichprobengröße
ß wird größer, wenn n kleiner wird
Eigenschaften der Fehleraten beim Hypothesentesten - Wert des Parameters in der Grundgesamtheit
ß ist vom wahren Wert des Parameters μ abhängig
Je dichter dieser bei dem unter de Nullhypothese angenommenen Wert liegt, desto größer ist die Wahrscheinlichkeit für einen Fehler ß
Ist der Wahre Wert von μ bei Annahme der Alternativhypothese nicht bekannt, kann die Wahrscheinlichkeit für ß im Gegensatz zum α nicht berechnet werden
Bei Richtigkeit H0 bedeutet
steigt die Wahrscheinlichkeit einen ß-Fehler zu begehen
will man ganz sicher gehen, muss man die Irrtumswahrscheinlichkeit weiter verringern (α = 0,1%)
bei Unterschreitung festgelegter Grenze, das dieses Ereignis recht unwahrscheinlich ist
bei wichtigen/aufwendigen/kostspieliegen Experimenten hat fälschlicherweise abgelehnte HA bedeutende Konsequnzen
Praktische Bedeutsamkeit von Signifikanz
Signifikantes Ergebnis sagt lediglich, dass es einen deutlichen Effekt in der Untersuchung gibt, aber nicht wie stark dieser wirklich ist
Besitz oft keine praktische Signifikanz
Ergebnis, dessen praktische Bedeutsamkeit durch beachtlichen Mittelwertunterschied offenkundig ist, ist wertlos, solang nicht sichergestellt ist, dass sieses Ergebnis nicht zufällig zusatnde kommt
Effektgrößen
= standardisierter Unterschied, der zwischen zwei Populationen mind. bestehen muss, um von praktisch bedeutsamen Effekt sprechen zu können
-> Bestimmung der Effektgröße erfordert intensive inhaltliche Auseinandersetzung mit der Untersuchung & muss vor der Durchführung der Prüfung gemacht werden
-> Mit Festlegung einer Effektgröße, wird Stichprobenumfang kalkulierbar
Beispiele für Effektgrößen
Cohens d, Pearson Korrelation r, Hedges g, Glass’s Δ
Cohens d
= Effektgröße für Mittelwertunterschied zwischen zwei Gruppen mit gleichen Gruppengrößen n sowie gleichen Gruppenvarianzen σ². Zur Beurteilung der praktischen Relevanz eines signifikanten Mittelwertunterschiedes
0,2 - klein
0,5 - mittel
0,8 - groß
Wofür gibt es den Korrekturfaktor (Wurzel aus 2) beim Choens d
Als Schätzer für gleiche Gruppengröße und unterschiedliche Vrainazen
Perason Korrelation r
meistgenutzte & ältestes Effektstärkenmaß
r = 0,1 - kleiner Effekt
r = 0,3 - mittlerer Effekt
r = 0,5 starker Effekt
Meta- Analyse
= ermöglicht Zusammenfassung versch. Untersuchungen zu einem wissenschaftlichen Forschungsgebiet
Empirische Einzelergebnisse inhaltlich homogener Primärstudien zusammengefasst
Ziel: Effektgrößeneinschätzung (Untersuchung ob Effekt vorliegt. und wie groß er ist)
Wann werden Meta- Analysen eingesetzt ?
Wenn die Stichproben der Primärstudien zu klein sind um verlässliche Ergebnisse zu bringen
-> Wenn Primärstudie nicht gleiche Methoden/Definitionen/ Stichproben aus Grungesamtheit nutzen, fraglich ob & wie Einflüsse von Gegenstand der Untersuchung getrennt werden können
Vorgehen Meta-Analyse
Umfasst ämtliche Elemente des sozialwissenschaftlichen Forschungsprozesses - wie bei Primärstudien
Auswahl geeignetes Forschungsproblems & Eingrenzung Forschungsgegenstand
Datenerhebung: systematischer Literaturrecherche
Informationen in gesammelten Publikationen kodiert & elektronisch aufbereitet
Eigentliche (statistische) Datenanalyse
Befundintegration
Heterogenitätsanalyse
Ergebnisaufbereitung und Interpretation im Bzg. auf das Forschungsproblem
Kritikpunkte Meta- Analyse
Grabage in Grabage out (Ergebnisse wenig valide, wenn jede beliebige Untersuchung, unabhängig von method. Qualität, in Metaanalyse eingeht)
Äpfel/ Birnen Problem (Metaanalysen fassen Untersuchungen mit unterschl. Operationalisierungs varianten zsm.)
Schubladenproblem (Häufig nur Ergebnisse publiziert, die angenommene Hypothese bestätigen o. signifikante Ergebnisse aufzeigen - Untersuchungen m. nicht signifikanten Ergebnissen häufig nict veröffentlicht
-> Verzerrung meta-analytischer Ergebnisse
Problem der abhängigen Messung (Wenn versch. abhängige Teilergebnisse an d. gleichen stichprobe erhgoben wurden -> es darf immer nur ein Ergebnis einer Untersuchung in Metaanalyse eingehen, da sonst diese Untersuchung größere gewichtung hat, als Untersuchung von der nur ein ergenis einfließt)
Was ist die Teststärke (statistical Power)
gibt an, mit welcher Wahrscheinlichkeit ein Signifikanztest zugunsten einer spezifischen Alternativhypothese entscheidet
Wahrscheinlichkeit, mit der eine Untersuchung signifikante Ergebnisse liefert
Bestimmung der Teststärke
Power = 1 - ß
Bestimung setzt Kenntnis über bestimmte Parameter voraus und ist schwierig:
Software
Tabelle
Faktoren der Teststärke (5 Faktoren)
Effektgröße - mit kleiner werdender Differnez μ0 -μ1 verringert sich Stärke des Signifikanztests
Stichprobengröße - wachsende Stichprobengröße vrgrößert Teststärke
Merkmalsstreuung - Teststärke sinkt m. wachsender Merkmalsstreuung
Signifikanzniveau - niedirge Signifikanzniveaus erhöhen die Teststärke
Ein- bzw. zweiseitiges Testen - Teststärke beim zweiseitigen Testen geringer als beim einseitigen
Art des Testverfahrens
Optimaler Stichprobenumfang
Stichprobenumfang optimal, wenn aufgrund der Untersuchungsergebnisse eine eindeutige Entscheidung über H0 & H1 getroffen werden kann
Alpha, Beta, Effektgröße nach inhaltlichen Kriterien festgelegt (nicht beliebig veränderbar)
einzig freier Parameter bleibt Stichprobenumfang N
Last changed2 months ago