Wie gelangt man an Daten?
Versuchsplanung
Versuchsplan (Design) einer Studie beschreibt die Art der Durchführung einer Studie, in Bezug auf die Anzahl, Art und Ausprägung der beteiligten Variablen und die konkreten Durchführungsbedingungen
3 Möglichkeiten der Versuchsplanung
Korrelative/explorative Designs (ex post facto)
es gibt keine/kaum Vorannahmen oder Vorbefunde, keine Theorie oder Hypothese
man kann keine Kausalität aufdecken
Quasiexperiment
es gibt eine Hypothese, Theorie oder Erwartung
ein Randomisieren ist aber nicht möglich
man kann Kausalität also „mit Vorbehalt“ aufdecken
Echte experimentelle Designs
es gibt eine Hypothese, Theorie oder Erwartung § Randomisieren ist möglich § Kausalität kann aufgedeckt werden (experimentelle Kontrolle)
Experiment
sind künstliche Eingriffe in die natürliche Welt
Ziel: systematische Veränderungen (Treatment/Manipulation) in einer unabhängigen Variable (UV) herstellen, die ursächlich zu einer Veränderung in einer abhängigen Variable (AV) führen
Alternativ-Erklärungen werden dabei ausgeschlossen
Störvariablen
Alternativ-Erklärungen beziehen sich auf Störvariablen
das sind Merkmale der Person oder der Situation, die eventuell ebenfalls die AV beeinflussen und daher den Effekt der UV auf die AV stören
man spricht von experimenteller Kontrolle von Störvariablen
Wie kann man Störvariablen ausschalten?
Bei Proband/innen:
Parallelisieren (matching): in allen Versuchsbedingungen bzw. Gruppen die Ausprägungen der potenziellen Störvariablen gleich verteilen -> Quasiexperiment
Randomisierung (!!!): zufällige Zuteilung der Personen zu den Versuchsbedingunge -> hier sorgt der Zufall für das gleichmäßige Verteilen von – auch unbekannten – Störvariablen (z.B. durch Lose, Würfeln, Zufallszahlen)
-> Experiment
In der Untersuchungssituation:
Konstanthalten: von Umgebungsbedingungen und Operationalisierungen
Elimination: Ausschalten der Störvariablen (z.B. Schalldämmung)
Doppelblindstudien: weder Versuchsleiter noch Versuchsperson wissen, in welcher Bedingung sie sind
Experimentelle Designs
bei Experimenten gibt es verschiedene Gestaltungsmöglichkeiten, was den so genannten Versuchsplan bzw. das Design angeht
Design hängt ab von:
der Anzahl der UVen: einfaktoriell,zweifaktoriell,mehrfaktoriell
dem Ort,wo das Experiment stattfindet: Labor,Feld
der Randomisierung der Versuchspersonen: echtes Experiment, Quasiexperiment
der Häufigkeit, mit der der Effekt gemessen wird: einfaches Design, Messwiederholungsdesign
welche Personen verglichen werden sollen: within, between
dem Vorhandensein einer Kontrollgruppe: ohne, mit
Faktorielle Designs
die UVen bei Experimenten werden auch Faktoren genannt
bei einer UV: einfaktorielles Design
bei zwei UVen: zweifaktorielles Design, usw. (bzw. mehrfaktorielles Design)
die Ausprägungen der UVen werden Faktorstufen genannt
Designs werden meist nach ihren Faktoren und Faktorstufen benannt: z.B.: 2x2- Design (sprich: zwei-mal-zwei-Design) -> 2 Faktoren mit je 2 Stufen; 2x3x3-Design -> 3 Faktoren mit 2, 3 und 3 Stufen
das Produkt ergibt die Anzahl der Bedingungen (z.B.: 2x3 = 6)
Vorteile Labor- und Feldexperiment
Labor-Experimente: höchste Kontrollierbarkeit
Feld-Experimente: gute externe (ökologische) Validität
Unterschied Experiment und Quasi-Experiment
Ein Quasi-Experiment ist ein wissenschaftliches Experiment, das Probanden gezielt anhand bestimmter Eigenschaften auswählt. Dadurch unterscheidet es sich von einem echten Experiment, das Versuchs- und Kontrollgruppen randomisiert zusammenstellt.
„echte“ Experimente setzen das randomisierte Zuteilen von Personen auf die Bedingungen voraus
ist die Gruppeneinteilung von Natur aus vorgegeben oder aus anderen Gründen keine Randomisierung möglich, spricht man von Quasi-Experimenten
§Beispiele für natürliche Gruppen: Geschlecht, Raucher/Nichtraucher, Gesunde vs. Patienten mit dem Krankheitsbild XY, Jüngere vs. ältere Altersklassen, Ländervergleiche, Psychologie- vs. Medizin-Studierende
Wann machen Messwiederholungen Sinn?
normalerweise wird der Effekt der UV auf die AV nur einmal gemessen
interessiert aber die Stabilität des Effektes (ob er über die Zeit anhält), kann er mehrfach gemessen werdenàMesswiederholung (repeated measures)
Messwiederholungen werden auch bei Vorher-Nachher-Vergleichen verwendet: hier werden Manipulationen geprüft, ohne dass unbedingt verschiedene Gruppen gebraucht werden
Unterschied within-Designs und between-Designs
Between-Subjects-Design
Bei einer experimentellen Studie mit Between-Subjects-Design werden alle Teilnehmenden während des Experiments nur mit je einer Behandlung untersucht.
Die Forschenden bewerten Gruppenunterschiede zwischen Teilnehmenden mit unterschiedlichen Behandlungen.
Within-Subjects-Design
Bei einem Within-Subjects-Design werden alle Teilnehmenden während des Experiments mit allen Behandlungen untersucht.
Die Forschenden testen dieselben Teilnehmenden wiederholt auf Unterschiede in der Reaktion auf unterschiedliche Behandlungen.
Vorteile/ Nachteile von within-Designs und between-Designs
Vorteile von within-Designs (und Nachteile von between-Designs)
geringere Anzahl von Versuchsteilnehmern nötig
Wegfall personenbezogener Störvariablenàperfekte Parallelisierung
Nachteile von within-Designs (und Vorteile von between-Designs)
Übungseffekte/Ermüdungseffekte: die Vertrautheit mit dem Untersuchungsmaterial hat einen systematischen Einfluss auf das Ergebnis
carry-over-Effekte: Manipulationen einer Versuchsbedingung beeinflussen andere Versuchsbedingungen (z.B. Stimmungsinduktion)
Gemischte Designs
within- und between-Manipulationen können bei verschiedenen Faktoren in ein und derselben Studie auftretenàgemischte Designs
das ist das klassische Design bei (klinischen) Interventionsstudien: Interventions- und Kontrollgruppe (between) werden vor und nach der Therapie untersucht (within)
Kontrollierte Designs
Kontrollgruppen erhalten – im Gegensatz zu Experimentalgruppen – keine Intervention oder kein Treatment oder ein Placebo
wenn die UV nur eine interessierende Ausprägung hat (z.B. eine bestimmte Intervention), ist eine Kontrollgruppe unerlässlich
wenn die UV mehrere interessierende Ausprägungen hat, die verglichen werden sollen, kann auf eine separate Kontrollgruppe verzichtet werden – das Design ist dann dennoch kontrolliert
Fazit: Experimente sollten randomisiert und kontrolliert sein
-> oft spricht man von RCT-Studien (randomized controlled trials)
Randomized Controlled Trial
Für wen soll die Aussage bzw. das Ergebnis einer Studie gelten?
-> Population (Grundgesamtheit) (z.B. alle Menschen, Raucher, Depressive, Männer, Angstpatienten, Europäer...)
Stichproben sollen die Population so gut wie möglich repräsentieren
das wird erreicht durch zufälliges Ziehen aus der Population
-> Jedes Individuum hat dieselbe Wahrscheinlichkeit in die Stichprobe zu kommen
Problem wenn zufällige Ziehungen nicht möglich sind: Störvariablen können aus einer repräsentativen Stichprobe eine selektive Stichprobe machen: bestimmte Personen fehlen systematisch ->
es gibt einen Bias
Welche Stichproben gibt es?
1. echte Zufallsstichprobe (sehr selten)
2. Cluster-Stichprobe (häufig verwendet)
§zufällige Ziehung von Clustern (z. B. Kliniken, Firmen, Schulklassen), daraus dann Analyse aller oder einiger Personen
die Analyse sollte sich dann auf die Cluster beziehen, nicht auf die Einzelpersonen (Ebene der Analyse sollte mit Ebene der Randomisierung übereinstimmen
Willkürliche Stichprobe / Convenience Sample (sehr häufig verwendet)
Verwendung einer leicht zugänglichen Gruppe von Personen (Studierende, Menschen in einer Fußgängerzone, auf einem Online-Portal, usw.)
-> ihre Repräsentativität für eine Population ist nicht bestimmbar
->generalisierene Aussagen sind unzulässig und Inferenzstatistik damit unmöglich
legitim und sinnvoll bei unbekannten oder schwer zugänglichen Populationen (z. B. Missbrauchsopfer) als erster Einstieg
Last changeda year ago