Inferenzstatistik
Zielsetzung von Hypothesentests
8.1 Methodik
8. HYPOTHESENTESTS
über- prüft die Stichprobener- gebnisse auf ihre Allge- meingültigkeit.
1. Wie ist es machbar, ausgehend von einer Stichprobe Schlüsse auf eine Grundge- samtheit zu ziehen?
Stichprobe repräsentativ für die Population sein
Das bedeutet, dass die Verhältnisse in der Population wie bspw. die Geschlechterverteilung möglichst gut wider- gespiegelt werden müssen.
Ziehen von Zufallsstichproben
Stichprobe möglichst groß
Mit einer gewissen Wahrscheinlichkeit spiegelt die Stichprobe nicht exakt die Grundgesamtheit wider, was bedeuten würde, dass die Stichprobenergebnisse nicht für die Allgemeinheit gelten.
2 Möglichkeiten
2. Wie ist die Güte dieser Schlüsse? Wie gut lassen sich also die Ergebnisse der Stich- probe für die Grundgesamtheit verallgemeinern?
zwei Möglichkeiten.
1.Mögl.
nicht nur eine Studie zur besagten Fragestellung durchführt, sondern mehrere
mehrere Stichproben zur Verfügung hätte, aus denen sich eine sog. Stichprobenverteilung ableiten ließe
findet aus zeitlichen, finanziellen und wissenschaftlichen Gründen in der Praxis wenig Anwendung.
2.Mögl.
statistischen Signifikanztests bzw. Hypothesentests
herauszufinden, ob und wie gut sich Stichprobenergebnisse auf die Allgemeinheit übertragen lassen.
Angabe der Irrtumswahrscheinlicheit, bei der Bestimmung dieser Ergebnisse,
wenn wir die Ergebnisse nur einer Stichprobe zur Verfügung haben
gängige Praxis
Null- und Alternativhypothesen
Beginn: Fragestellung zunächst in zwei vollkommen konträre Hypothesen überführt
erste Hypothese wird als Nullhypothese H0
jenen Zustand, in dem es keinen Effekt gibt
Nullhypothese ist konservativ und vermutet keinen Effekt
Bsp: H0: Geschlecht einer Pflegekraft keinen Unterschied im Einkommen hervorruft.
Alternativhypothese H1 geht von einem Effekt aus
gegenteilige Situation
ein solcher Effekt existiert.
In den meisten Untersuchungen bildet die Alternativhypothese das ab, was man erforschen bzw. beweisen möchte.
BSP: H1: Geschlecht einer Pflegekraft einen Unter- schied im Einkommen hervorruft.
Fragestellungen mit Test auf Lageparameter
Verschiedene Hypothesenarten
Ein Test auf Lageparame- ter überprüft bspw. das Vorliegen eines Mittel- werts in der Grundge- samtheit
• H0: Die Pflegerkräfte machen wöchentlich im Durchschnitt 10 Überstunden.
• H1: Die Pflegerkräfte machen wöchentlich durchschnittlich mehr oder weniger als 10 Überstunden.
Zusammenhangshypothesen
Zusammenhangshypothese vermutet eine Beziehung zwischen zwei oder mehr Variablen
Stichwörter: Zusammenhang oder Einfluss (= wirkt sich aus…)
• H0: Es besteht kein Zusammenhang zwischen den geleisteten Arbeitsstunden und dem Zigarettenkonsum.
• H1: Es besteht ein Zusammenhang zwischen den geleisteten Arbeitsstunden und dem Zigarettenkonsum.
zweite Mögl:
• H0: Die Anzahl an geleisteten Arbeitsstunden im Pflegedienst wirkt sich nicht auf den Zigarettenkonsum aus.
• H1: Die Anzahl an geleisteten Arbeitsstunden im Pflegedienst wirkt sich auf den Zigarettenkonsum aus.
Unterschiedshypothesen
Unterschiedshypothese vermutet zwischen zwei oder mehr Gruppen einen Unterschied bzgl. einer Variable
• H0: Männliche und weibliche Pflegekräfte verdienen durchschnittlich gleich viel.
• H1: Männliche und weibliche Pflegekräfte verdienen durchschnittlich unterschiedlich viel.
Veränderungshypothesen
Veränderungshypothese ist eine Unterschiedshypothese, die zusätzlich auf eine Veränderung prüft.
• H0: Der Gesundheitszustand ist nach der Therapie identisch mit dem vor der Therapie.
• H1: Der Gesundheitszustand ist nach der Therapie anders als vor der Therapie.
charakterisiert, dass eine einzige Gruppe an Merkmalsträgern zu mehreren Zeitpunkten oder in verschiedenen Situationen beobachtet wird.
Gerichtete vs. ungerichtete Hypothesen
Def: Ungerichtete Hypothesen vermuten keine bestimmte Effektrich- tung
wer- den dann formuliert, wenn es die bisherige Forschung noch nicht hergibt, in eine spezielle Richtung zu testen.
Die Nullhypothese enthält zusätzlich zur entgegengesetzten Richtung auch immer die Gleichheit.
Def: Gerichtete Hypothesen vermuten eine bestimmte Effektrichtung
in der Alternativhypothese immer die konkrete Vermutung in eine ganz bestimmte Richtung formuliert wird
Formulierungen geben wie „mehr als“, „weniger als“, „positiv“, „negativ“ etc.
Hypothesenpaar gerichtet oder ungerichtet formuliert wird, hängt vom bisherigen Forschungsstand ab. Reicht die bis dato erzielte Forschungsbasis aus, um Hypothesen gerichtet zu formulieren, dann sollte dies auch getan werden. Ist aber bisher in sämtlichen Forschungsberichten keine eindeutige Richtung herausgearbeitet worden oder aber der Bereich befindet sich forschungstechnisch noch in den Anfängen, dann sollte immer auf ungerichtete Hypothesen zurückgegriffen werden.
Bsp:
1. Leisten Pflegekräfte durchschnittlich mehr als 10 Überstunden pro Woche?
H0: Die Pflegekräfte machen wöchentlich durchschnittlich höchstens 10 Überstunden.
H1: Die Pflegekräfte machen wöchentlich durchschnittlich mehr als 10 Überstunden.
2. Wirken sich die geleisteten Arbeitsstunden negativ auf den Zigarettenkonsum aus?
H0: Die geleisteten Arbeitsstunden wirken sich nicht negativ auf den Zigarettenkon- sum aus.
H1: Die geleisteten Arbeitsstunden wirken sich negativ auf den Zigarettenkonsum aus.
3. Verdienen männliche Pflegekräfte im Durchschnitt mehr als die weiblichen Pflege- kräfte?
H0: Männliche Pflegekräfte verdienen durchschnittlich höchstens so viel wie weibliche Pflegekräfte.
H1: Männliche Pflegekräfte verdienen durchschnittlich mehr als weibliche Pflege- kräfte.
4. Ist der Gesundheitszustand nach der Therapie besser als vor der Therapie?
H0: Der Gesundheitszustand ist nach der Therapie höchstens so gut wie vor der Thera- pie.
H1: Der Gesundheitszustand ist nach der Therapie besser als vor der Therapie.
Entscheidung für eine Hypothese
mögliches Ergebnis:
Nullhypothese wird abgelehnt = Effekt
= die durch die Stichprobe erhaltenen Ergebnisse zu der in der Alternativhypothese formulierten Vermutung passen. ( = Effekt)
Nullhypothese nicht abgelehnt = kein Effekt
kann davon ausgegangen werden, dass die durch die Stichprobe erzielten Ergebnisse für keinen vor- handenen Effekt sprechen.
signifikantes Ergebnis = wenn wir es schaffen, die Nullhypothese abzulehnen und damit einen Effekt zu erzielen.
Fünf Schritte
Vorgehen bei Hypothesentests
1. Aufstellen des Hypothesenpaares
2. Festlegung eines Signifikanzniveaus
3. Berechnung der Prüfgröße
4. Festlegen des kritischen Werts bzw. Berechnen des p-Wert
5. Entscheidung
Beispiel: Wir möchten herausfinden, ob deutsche Pfleger:innen durchschnittlich 10 Überstunden pro Woche ableisten. Zu diesem Zweck wurden acht Pfleger:innen hinsichtlich ihrer geleisteten Über- stunden befragt.
1. Aufstellen des Hypothesenpaare
Hypothesen aufgestellt.
Im vorliegenden Beispiel würde die
Nullhypothese, dass durchschnittlich 10 Überstunden geleistet werden, gegen die
Alternativhypothese, dass durchschnittlich mehr oder weniger als 10 Überstunden angehäuft werden, getestet.
Signifikanzniveau α die sog. Irrtumswahrscheinlichkeit festgelegt
mit welcher Wahrscheinlichkeit wir uns einen Fehler erlauben, wenn wir uns gegen die Nullhypothese und damit für die Alternativhypothese entscheiden.
Bei der Entscheidung bzgl. einer der beiden Hypothesen können wir uns immer irren,
denn es liegt uns immer nur eine Stichprobe vor.
keinesfalls nachträglich zu ändern,
gängigste Signifikanzniveau liegt bei 5 %
Wahrscheinlichkeit von 5 % einen Fehler begeht, wenn man sich gegen die Nullhypothese entscheidet.
Wahrscheinlichkeit von 95 % die richtige Entscheidung getroffen hat
strengeres Signifikanzniveau liegt bei 1 %. S
99 % sicher sein, die richtige Entscheidung getroffen
schwächeres Sig- nifikanzniveau liegt bei 10 %
wenn die Nullhypo- these die Forschungshypothese ist.
Prüfgröße wird benö- tigt, um zu einer Entschei- dung bzgl. der beiden Hypothesen zu kommen. Sie nimmt je nach Test- verfahren eine andere Gestalt an
Jedes statistische Testverfahren beinhaltet die Berechnung einer Prüfgröße
z-Test oder t-Test für eine Stichprobe
4. Festlegen des kritischen Werts bzw. Berechnen des p-Werts
Die zweite Grundlage zur Entscheidungsfindung bildet der
kritische Wert = wird einer bestimmten Verteilung entnommen.
der sogenannte p-Wert. (—> wird durch Statikstikprogramme ausgegeben)
beschreibt die sog. Überschreitungswahrscheinlichkeit und gibt die Wahrscheinlichkeit an, dass unter Gültigkeit der Nullhypothese das gefundene Stichprobenergebnis oder sogar noch ein extremeres auftritt
p-Wert an, wie groß die Wahrscheinlichkeit ist, eine solche Überstundenzahl oder eine noch größere zu erhalten
Entscheidung bzgl. der Nullhypothese.
1. Möglichkeit,
die Prüfgröße sowie den kri- tischen Wert heranzuziehen.
Prüfgröße die kritische Grenze übersteigt.
Um die Nullhypothese ablehnen zu können, müsste die betragsmäßige Prüfgröße größer als die betragsmäßige kritische Grenze sein:
Beispiel gilt Prüfgröße = 2,2 > 1,96 = kritische Grenze, wodurch die Nullhy- pothese abgelehnt werden kann.
2.Möglichkeit
Kombination aus Signifi- kanzniveau und p-Wert. Hierbei gilt es, dass der p-Wert niedriger sein muss als das Signifi- kanzniveau, um die Nullhypothese ablehnen zu können
Beispiel kommen wir mit p-Wert = 0,03 < 0,05 = α ebenfalls zu dem Ergeb- nis, die Nullhypothese ablehnen zu können. Wir können demnach festhalten, dass die durch die Stichprobe ermittelten durchschnittlichen 11,5 Stunden weit genug von den hypothetischen 10 Überstunden entfernt sind, um sich gegen die Nullhypothese zu ent- scheiden. Die Pfleger:innen leisten demnach durchschnittlich signifikant mehr Überstun- den als die vermuteten 10.
Einflussgrößen der Testentscheidung
drei wesentliche Faktoren
1. Umstand, ob die Hypothesen gerichtet oder unge- richtet formuliert werden
Auswirkung auf den Ablehnungsbereich unter der Nullhypothese.
ungerichteter Form,
ob die Pflegekräfte durchschnittlich 10 Überstunden absolvieren, so bedeutet dies gleichzeitig, dass sie unter der Alternativhypo- these mehr oder weniger als 10 Überstunden leisten können.
Ablehnungsbereich beim ungerichteten Testen
Unter der Nullhypothese geht man im Zentrum davon aus, dass sich bspw. der hypothetische Mittelwert von 10 nicht vom Stichprobenmittel- wert unterscheidet. Der Unterschied liegt demnach bei 0
Wenn nun durch die ungerichte- ten Hypothesen eine Abweichung von der 0 sowohl nach oben (Pfleger:innen leisten im Durchschnitt mehr als 10 Überstunden) als auch nach unten (Pfleger:innen leisten durch- schnittlich weniger als 10 Überstunden) möglich ist, dann teilt sich auch der Ablehnungs- bereich in Form des Signifikanzniveaus gleichmäßig auf beide Seiten auf.
Signifikanzniveau läge bei 5 %, so würde es sich auf beide Seiten mit einem Wert von jeweils 2,5 % aufteilen
Entweder die rechte oder die linke Grenze in Form des senkrechten Strichs müssten über- bzw. unterschritten werden, um sich von der Nullhypothese distan- zieren zu können.
bestimmte Richtung
durchschnittlich mehr als 10 Überstunden leisten,
nur auf einer Seite der Verteilung.
Ablehnungsbereich beim gerichteten Testen
welcher der beiden Tests ein Ablehnen der Nullhypothese leichter macht.
Highlight : Weg über die kritische Grenze hinaus ist schlicht- weg beim gerichteten Test kürzer als der beim zweiseitigen Test. Auch aus inhaltlicher Per- spektive ist das schlüssig: Wenn bereits ein begründeter Verdacht in eine bestimmte Rich- tung besteht, so kann es auch leichter sein, diese Richtung zu bestätigen. Der gerichtete Test erlaubt damit ein schnelleres Ablehnen der Nullhypothese
2.Stichprobengröße.
Mit zunehmender Stichprobengröße wird das Ablehnen der Nullhypothese leichter.
Bsp: Betrachten wir erneut das Überstundenbeispiel und gehen von im Durchschnitt 11,5 Überstunden unter den Pflegekräften aus. Werden diese durchschnittlich 11,5 Überstunden bspw. für nur 20 Personen ermittelt, so wird der Test vorsichtig. Er berücksichtigt, dass es sich bei dieser Stichprobe nur um eine sehr kleine handelt, in der potenzielle Ausreißer eine große Wirkung haben und damit das Ergebnis verzerren können. Ergeben sich die 11,5 Überstunden jedoch für 1000 Pfleger:innen, so kann der Test eher auf den berechneten Mittelwert vertrauen, da Ausreißer kaum einen Einfluss nehmen können
3.Wahl des Signifikanzniveaus
Signifikanzniveau läge nicht bei 5 %, sondern bei 10 %. —> Fläche des Ablehnungsbereichs größer und dadurch näher an das Zentrum (0) rücken. Der Weg, um die kritische Grenze zu überschreiten, wird damit kürzer.
Fehlerarten bei Hypothesentests
Mögliche Fehler bei der Entscheidung für eine Hypothese
Fehler 1. Art/Alpha- Fehler beschreibt das fälschliche Ablehnen der Nullhypothese
Ist es uns wichtig, den Fehler 1. Art möglichst gering zu halten, so können wir im geschilderten Testablauf überlegt wählen und bspw. auf 1 % setzen.
Fehler 2. Art/Beta-Fehler beschreibt das fälschliche Beibehalten der Nullhypothese
β-Fehler nicht direkt beeinflussen können, so können wir ihn über α steuern, denn die beiden Fehler hängen eng – und zwar entgegengesetzt – miteinander zusammen. Wünschen wir uns einen niedrigen β-Fehler, so sollten wir α möglichst groß wählen
Entscheidung für eine der beiden Hypothesen (Null/Alternativhypothese) und diese trifft für die Population/Grundgesamtheit zu = korrekte Entscheidung
Last changed17 days ago