Grundlagen der Hypothesentestung
Theoretisch-inhaltliche Hypothese (TIH)
Empirisch-inhaltlichen Hypothesen (EIH)
Statistische Vorhersage (SV)
Testhypothesen (THn):H0 und H1
Entscheidungskriterien für die hypothesentestung
Geltungsbereich der der Hypothese: Situations-, Variablen- und Populationsvalidität
Effektgröße: Ist der gefundene Unterschied / Zusammenhang inhaltlich relevant?
z.B. Größe der Korrelation r oder Mittelwertsunterschied d
Signifikanztest (Sind die Beobachtungen
Unwahrscheinlich unter H0?) mit p-Wert
Population
Grundgesamtheit aller potenziellen Untersuchungsobjekte (Personen, Objekte, Organisationen, Verhaltensweisen, ...) für eine Fragestellung (entspricht „Vollerhebung“)
Beispiele für Populationen
Gesamtheit aller Besucher einer Veranstaltung
Die Fünftklässler in Spanien,
70-bis 80-jährige Diabetespatienten in Deutschland
alle mittelständischen Unternehmen in Rumänien
Population aller Großfamilien einer Stadt
Population aller Zwischenrufe in Bundestagsdebatten im letzten Jahr
Population aller bisherigen Anti-Rauch-Kampagnen der Bundeszentrale für gesundheitliche Aufklärung [BZgA]
Population aller Fußgänger, die auf dem Weg zur Arbeit Straßen überqueren
Stichprobe
Teilmenge aus einer Grundgesamtheit, die unter bestimmten Gesichtspunkten (gemäß der Fragestellung) ausgewählt wurde.
Repräsentativität (Merkmalsadäquanz)
Die Stichprobe sollte alle Merkmale der Population adäquat (etwa: entsprechend/angemessen) enthalten, damit die Stichprobenergebnisse auf die Population übertragen werden können.
Einfache Zufallstichprobe (simple random sampling)
Alle Elemente der Population haben die gleiche Wahrscheinlichkeit.
Zufallsstichprobe durch zufälliges Auswählen von BürgerInnen (z.B. über Meldeamt); z.B. für Wahlprognosen
->Praktisch nie der Fall in der psychologischen Forschung, auch wenn das die Grundannahme vieler statistischer Verfahren ist
Angefallene Stichprobe (convenience sample)
Untersucht werden Personen, die verfügbar oder leicht erreichbar sind
Studierende, die Vpn-Stunden erbringen müssen
Personen, die sich auf eine Anzeige oder Einladung melden (Aushang, Online z.B. via Mturk)
In der Praxis häufigste Art der Stichprobe in der Psychologie und anderen Disziplinen Deutliche Einschränkungen bzgl. der Generalisierbarkeit müssen berücksichtigt werden.
Vorteile/ Nachteile: Schneeballverafhren - Angefallene Stichprobe
Vorteil: Schwer erreichbare Gruppen sind leichter zu rekrutieren (Personen mit seltenen Krankheiten, Obdachlose, Ex-Sträflinge, Computerhacker, Bürger:innen mit bestimmten politischen Einstellungen)
Nachteil: Es ist wahrscheinlich, dass VPn andere VPn vorschlagen, die ähnliche Merkmale wie sie selbst aufweisen (weitere Verringerung der Repräsentativität)
Systematische Zufallstichprobe (systematic sampling)
Elemente der Stichrobe werden nicht komplett zufällig ausgewählt, sondern nach einer bestimmten Systematik
Bewohner einer Straße mit 100 Häusern sollen zur Einführung einer Tempo-30-Zone befragt werden. Es werden nicht zufällig Häuser ausgewählt, sondern z.B. jedes 3 Haus.
Wahlprognosen: Jede/r 10. WählerIn, die Wahllokal verlässt, wird befragt, so dass die Erhebung über den ganzen Tag geht
Geschichtete/Stratifizierte Zufallstichprobe (stratified sampling)
Elemente der Stichprobe werden nicht komplett zufällig ausgewählt, sondern es werden zuerst Merkmale bestimmt, an Hand derer die Populationen in Subgruppen unterteilt werden kann. Innerhalb dieser Subgruppen wird dann zufällig gezogen.
Quotenstichprobe (quota sampling)
Bei der Quotenstichprobe geben die Forscher:innen die Merkmale bzw. ihre Kombinationen vor und die Auswahl der Teilnehmer erfolgt demgemäß gezielt und nicht zufällig.
Klumpenstichprobe („cluster sample“)
Man zieht eine Klumpenstichprobe, indem man aus einer in natürliche Gruppen (Klumpen) gegliederte Population nach dem Zufallsprinzip eine ausreichende Anzahl von Klumpen auswählt und diese Klumpen dann vollständig untersucht
-> (willkürliche Auswahl der Klumpen = Gelegenheitsstichprobe!)
-> Kann organisatorisch einfacher sein, erlaubt die Schätzung von Effekten auf Ebene der Individuen (Schüler) und Klumpen (Lehrer)
Beispiele für Fehlerquellen
Abdeckungsfehler
Hohe Ausfallrate
Merkmale und Definitionen eines Experiments
die systematische Beobachtung einer abhängigen Variablen (AV; dependent variable) unter verschiedenen Bedingungen einer unabhängigen Variablen (UV; independent variable)
bei gleichzeitiger Kontrolle der Störvariablen,
wobei die zufällige Zuordnung von Probanden und experimentellen Bedingungen gewährleistet sein muss (Randomisierung).
Störvariablen
Neben der unabhängigen Variable gibt es weitere Einflussgrößen und Faktoren, die die abhängige Variable beeinflussen können. Zu Störvariablen werden diese Einflussgrößen, wenn die Probanden der unterschiedlichen experimentellen Bedingungen auf unterschiedliche Ausprägungen dieser Einflussgrößen treffen.
Konfundierung
Die systematische Variation von Störvariablen mit den Stufen der UV nennt man Konfundierung.
Klassifikation von Störvariablen
Versuchspersonen- / Probandenmerkmale
(Mögliche) Störvariablen, die mit den Proband:innen verbunden sind (Alter, Geschlecht, IQ,Ausbildung, Religion, ...)
Situationsmerkmale
(Mögliche) Störvariablen, die mit der Untersuchungssituation verbunden sind (Tageszeit,Untersuchungsmaterialien, Beleuchtung, Lärm, ...).
Versuchsleitermerkmale
(Mögliche) Störvariablen, die mit den Versuchsleiter:innen verbunden sind (z.B. Person A erhebt alle Proband:innen in einer Bedingung und Person B alle in der anderen Bedingung; freundlich in einer Bedingungen aber nicht in anderer Bedingung, ebenso alle Versuchspersonenmerkmale aber für die Versuchsleiter)
Rosenthal-Effekt
Als Rosenthal-Effekt bezeichnet man einen Verzerrungseffekt von Studienergebnissen, der durch die Erwartungen der Versuchsleiter:innen gegenüber den Proband:innen verursacht wird.
Nenne sie verschiedene Methoden zur Kontrolle von Störvariable
Randomisieren
Konstanthaltung,
Elimination
systematische Variation
zufällige Variation
Parallelisieren
Blindversuche
Wann liegen Spezielle Störeffekte vor?
wenn die Probanden mehrfach im gleichen Experiment beobachtet werden (Messwiederholung).
Sequenzeffekte
störende Auswirkungen auf die abhängige Variable ergeben.
Positionseffekte: z.B. durch Ermüdung ist Performanz zu Anfang besser als am Ende oder durch Lerneffekte ist Performanz am Ende besser als zu Beginn
Übertragungseffekte (carry over effects): Zeitlich frühere Bedingungen/Messungen beeinflussen spätere Bedingungen/Messungen. Beispiel Lernen von Wortlisten: Lernstrategie bei Liste 1 kann das Lernen von späteren Listen beeinflussen
zwischenzeitliches Geschehen und natürliche Veränderungen: Wenn die Messungen über einen längeren Zeitraum erfolgen (Tage, Wochen, Jahre), kann zwischenzeitliches Geschehen die Messungen beeinflussen (spezifische Ereignisse oder Entwicklungsprozesse)
(Störvariablen können auch im Treatment selbst angesiedelt sein, d.h., im Kontext der UV verborgen sein)
Wozu wird die vollständige interindividuelle
Balancierung verwendet?
Zur Kontrolle von Positions- und Übertragungseffekten, so dass jede Bedingung / Item gleich häufig an jeder Position auftritt.
Die Anzahl der Teilnehmer:innen pro Balancierung wird konstant gehalten;
die Zuweisung zu den Reihenfolge erfolgt zufällig (randomisiert)
Versuchsplananlage
Die Versuchsplananlage enthält die strukturellen Informationen eines Experiments: Anzahl der Faktoren, Faktorstufen und Kombinationen der Faktorstufen.
Haupteffekte
Haupteffekte (HE) prüfen die isolierte Wirkung einer UV auf die AV.
Haupteffekte zeigen sich im Vergleich der Mittelwerte der Stufen des Faktors (μA1, μA2,...).
Pro UV kann ein Haupteffekt berechnet werden.
Einfache (bedingte) Haupteffekte
Einfache (bedingte) Haupteffekte (EHE) zeigen sich im zeilen- bzw. spaltenweisen Vergleich der Zellenmittelwerte in einer Stufe des jeweils anderen Faktors, z.B. Einfluss der Stufen von UV A innerhalb der Stufen der UV B.
Last changeda year ago