(Folie 10) Warum testen wir nicht die gesamte Grundgesamtheit?
Grundgesamtheit = alle potenziellen Untersuchungseinheiten (z. B. alle 9-jährigen Kinder weltweit).
→ Problem: Unmöglich, alle zu testen → stattdessen nur einen Teil: die Stichprobe.
(Folie 11) Was macht eine „gute“ Stichprobe aus?
Stichprobe = ausgewählte Teilmenge der Grundgesamtheit.
→ Soll repräsentativ sein: Merkmale der Grundgesamtheit im ähnlichen Verhältnis enthalten.
Beispiel: Wenn die Grundgesamtheit 50 % Frauen, 48 % Männer, 2 % divers hat → sollte die Stichprobe ähnlich zusammengesetzt sein.
(Folie 12) Wie kann man eine Grundgesamtheit klar abgrenzen?
Eindeutige Kriterien wählen (leicht messbar, relevant zur Frage).
→ Eingrenzen nach Zeit, Ort und Kultur.
Beispiel: „Alle Erwachsenen mit bipolarer Störung in Deutschland im Jahr 2024“ statt „alle Menschen“.
📍 Bild: Eine Landkarte mit Zoom auf genau das Zielgebiet.
(Folie 13) Was ist der Unterschied zwischen Vollerhebung, Einzelfall und Stichprobenerhebung?
Vollerhebung – alle Mitglieder der Grundgesamtheit (selten).
Einzelfall-Studie – nur 1 Objekt untersucht.
Stichprobenerhebung – nur Teilmenge untersucht (Standard in Psychologie). 💡 Merkhilfe: „Alle – Einer – Einige“.
(Folie 14) Warum arbeiten Psycholog*innen fast immer mit Stichproben?
Grundgesamtheit zu groß.
Nicht alle bekannt/erreichbar.
Untersuchung oft zu aufwändig oder belastend.
Hohe Kosten. Bild: Ein Forscher vor einem Berg an Akten – wählt nur einen kleinen Stapel aus.
Q: (Folie 15) Was bedeutet „Repräsentativität“ einer Stichprobe?
A: Eine repräsentative Stichprobe bildet die Grundgesamtheit realistisch ab.
→ Populationsparameter = echter Wert in der Grundgesamtheit (unbekannt).
→ Stichprobenparameter = gemessener Wert in der Stichprobe.
💡 Je weniger repräsentativ, desto ungenauer wird der Populationsparameter geschätzt.
Q: (Folie 16–19) Was zeigt das „Literary Digest Disaster“?
A: USA 1936: 10 Mio. befragt, 2,4 Mio. nahmen teil → Vorhersage komplett falsch.
Grund:
Selektionsbias – nur wohlhabende Menschen (Telefon, Auto, Zeitschriften).
Non-Response Bias – Demokraten antworteten seltener. ➡ Lektion: Große Stichprobe nützt nichts, wenn sie nicht repräsentativ ist. 💡 Merksatz: „Lieber klein & passend als groß & verzerrt.“
Q: (Folie 20) Was sind die zwei häufigsten Verzerrungen bei Stichproben?
Selektionsbias – Verzerrung durch die Auswahlgrundlage (Forscher schließt unabsichtlich Gruppen aus).
Non-Response Bias – Ausfall von ausgewählten Personen (Teilnehmer lehnen ab oder brechen ab). 📍 Tipp: Methoden kombinieren, um Verzerrung zu verringern.
Q: (Folie 21) Muss eine Stichprobe immer 100 % repräsentativ sein?
Nein – nicht nötig, aber:
Relevante Merkmale müssen abgedeckt sein (auch wenn nicht alle bekannt sind).
Merkmalsspezifische Repräsentativität: nur relevante Merkmale stimmen überein.
Globale Repräsentativität: alle Merkmale stimmen überein (selten).
Q: (Folie 22) Warum sind Psychologie-Studien mit Studierenden oft nicht repräsentativ?
A: Viele Probanden sind W.E.I.R.D.: White, Educated, Industrialized, Rich, Democratic.
→ Ergebnisse lassen sich oft nicht auf andere Bevölkerungen übertragen.
Bild: Eine Lupe, die immer auf dieselbe kleine Ecke der Weltkarte gerichtet ist.
Q: (Folie 23) Warum sind fehlende Daten ein Problem für Repräsentativität?
A: Fehlende Daten können die Zusammensetzung der Stichprobe verzerren.
→ Gründe: technische Fehler, Abbruch, keine Lust, bestimmte Gruppen antworten nicht.
💡 Bild: Ein Puzzle mit fehlenden Teilen – das Bild ist nicht mehr vollständig.
Q: (Folie 24) Welche 3 Hauptarten fehlender Daten gibt es?
MCAR – Missing Completely At Random → reiner Zufall.
MAR – Missing At Random → systematisch, aber nicht direkt mit Hypothese verbunden.
NMAR – Not Missing At Random → systematisch & direkt mit Hypothese verknüpft. 📍 Merkhilfe: „Completely – At – Not“ = von zufällig bis kritisch.
Q: (Folie 25) Was ist „MCAR“ und warum ist es relativ unproblematisch?
A: MCAR = Daten fehlen rein zufällig (z. B. Stromausfall, Messgerät-Batterie leer).
→ Kein Einfluss auf Repräsentativität, aber Stichprobe wird kleiner.
Bild: Regen fällt zufällig auf ein Feld – trifft manche Stellen, andere nicht.
Q: (Folie 26) Was ist „MAR“ und wie kann man es korrigieren?
A: MAR = Daten fehlen wegen Merkmalen, die nur indirekt mit Hypothese zu tun haben.
Beispiel: Männer reisen öfter mit Auto → mehr Männer bleiben im Stau stecken → fallen aus.
→ Effekt kann statistisch korrigiert werden (z. B. Gewichtung).
Q: (Folie 27) Was ist „NMAR“ und warum ist es besonders kritisch?
A: NMAR = Daten fehlen wegen Merkmalen, die direkt mit der Hypothese zusammenhängen.
Beispiel: Studie zu Einkommen & Ernährung → ärmere Menschen nehmen seltener teil.
→ Schwer korrigierbar → Ergebnisse stark verzerrt.
Bild: Ein Thermometer, das ausgerechnet bei Fieberpatienten ausfällt.
Q: (Folie 29) Wann ist eine Stichprobe in der Regel repräsentativ?
A: Meist nur bei einer Zufallsstichprobe:
→ Jedes Mitglied der Grundgesamtheit hat gleiche Chance, ausgewählt zu werden.
💡 Ausnahme: Klinische Studien mit freiwilliger Teilnahme → oft nicht zufällig.
Q: (Folie 30–31) Was ist eine Zufallsstichprobe und warum ist die Größe wichtig?
A: Zufallsstichprobe = gleiche Auswahlchance für alle.
→ Je größer die Stichprobe, desto wahrscheinlicher ist eine realistische Abbildung der Grundgesamtheit.
🚫 Eine Zufallsstichprobe mit n=1 macht keinen Sinn.
Q: (Folie 33) Was ist eine einfache Zufallsstichprobe?
A: Direkte, zufällige Auswahl aus der Grundgesamtheit (z. B. Einwohnermeldeamt-Liste).
Bild: Glücksrad mit allen Namen, zufällig gezogen.
Q: (Folie 34) Was ist eine geschichtete Zufallsstichprobe?
A: Grundgesamtheit wird in Schichten (Gruppen) eingeteilt → aus jeder Schicht zufällig ziehen.
Beispiel: Rentner aus jedem Bundesland.
💡 Merkhilfe: „Erst sortieren, dann losen.“
Q: (Folie 35) Was ist eine mehrstufige Zufallsstichprobe?
A: Mehrere Zufallsauswahlen hintereinander.
Beispiel: Erst zufällig Landesverbände auswählen → dann zufällig Mitglieder daraus.
📍 Bild: Zwei Türschlösser – beide müssen zufällig geöffnet werden.
Q: (Folie 36) Was ist eine Klumpenstichprobe?
A: Zufällig ganze „Klumpen“ (Gruppen) auswählen → alle darin untersuchen.
Beispiel: Bestimmte Schulklassen zufällig wählen → alle Schüler testen.
💡 Bild: Obstkiste statt einzelner Äpfel ziehen.
Q: (Folie 38) Was ist eine anfallende Stichprobe?
A: „Wer gerade vorbeikommt“ → keine Zufallsauswahl, sondern Bequemlichkeitsprinzip.
Beispiel: Erste 100 Passanten in Fußgängerzone.
🚫 Gefahr: Hohe Verzerrung.
Q: (Folie 39) Was ist eine Quotenstichprobe?
A: Auswahl gezielt nach bestimmten Merkmalen (z. B. Alter, Geschlecht), aber nicht zufällig.
Beispiel: 50 % Männer, 50 % Frauen, gezielt angesprochen.
Q: (Folie 40) Was ist eine theoretische Stichprobe?
A: Auswahl nach theoretischem Interesse, um möglichst breite oder besondere Fälle zu erfassen.
Beispiel: Verschiedene Arten von Depression gezielt in Studie aufnehmen.
Q: (Folie 41) Wann wählt man zufällige vs. nicht-zufällige Stichproben?
Zufallsstichprobe → für Verallgemeinerung der Ergebnisse.
Nicht-zufällig → für explorative Forschung oder praktische Einschränkungen. 💡 Realität: Viele Psychologiestudien nutzen anfallende Stichproben – nicht optimal.
Q: (Folie 43) Wovon hängt die optimale Stichprobengröße ab?
Anzahl relevanter Merkmale → je mehr, desto größer die Stichprobe.
Anzahl Merkmalsausprägungen → je vielfältiger, desto größer.
Häufigkeit seltener Ausprägungen → selten = große Stichprobe nötig. 💡 Beispiel: Genvariante bei 1 von 1000 Personen → riesige Stichprobe nötig.
Q: (Folie 44) Warum gilt oft die „n=30“-Regel?
A: Ab n = 30 → Normalverteilung kann erwartet werden (Voraussetzung für viele statistische Tests).
⚠ Trotzdem immer prüfen, ob Verteilung tatsächlich normal ist.
📍 Merksatz: „Ab 30 wird’s normal – aber lieber nochmal schauen.“
Q: (Folie 44) Welche Faustregel gilt pro Merkmal?
A: Mindestens 5 Personen pro Merkmal, um Varianzanteile sinnvoll zu berechnen.
💡 Bild: Mindestens 5 Puzzleteile pro Farbe, um Muster zu erkennen.
Q: (Folie 45) Wie hängen Stichprobengröße und Effektschätzung zusammen?
A:
Größere Stichprobe → präzisere Schätzung der Effektstärke.
Kleinerer Effekt → größere Stichprobe nötig, um ihn zu entdecken.
📍 Effektgröße = Maß, wie stark ein Zusammenhang oder Unterschied ist.
Q: (Folie 46) Können manche Hypothesen schon mit n=1 getestet werden?
A: Ja – z. B. „Schwarzer Schwan“-Hypothesen (ein Gegenbeispiel widerlegt die Theorie).
Beispiel: Schwarzer Schwan gefunden → Theorie „alle Schwäne sind weiß“ falsch.
Oder: Langzeitstudie zu Fingerknacken & Arthrose mit nur 1 Person über 50 Jahre.
Q: (Folie 64) Was ist die offizielle Definition eines Experiments in der Psychologie?
A: Systematische Beobachtung einer abhängigen Variablen (AV)
→ unter verschiedenen Bedingungen einer unabhängigen Variablen (UV)
→ bei Kontrolle von Störvariablen
→ mit zufälliger Zuordnung der Probanden zu Bedingungen.
💡 Bild: Wissenschaftslabor mit zwei gleich großen Gruppen – nur 1 Faktor wird verändert.
Q: (Folie 65) Was ist die abhängige Variable (AV)?
A: Variable, die gemessen wird, weil sie den interessierenden Effekt widerspiegelt.
Beispiel: Punktzahl in Problemlöse-Test nach Lernpause.
📍 Merksatz: „AV = Antwort des Systems auf unsere Manipulation.“
Q: (Folie 66) Was ist die unabhängige Variable (UV)?
A: Variable, die manipuliert wird, um ihre Wirkung auf die AV zu testen.
Beispiel: Pausen vs. keine Pausen beim Lernen.
💡 Bild: Regler, den der Versuchsleiter verstellt.
Q: (Folie 67) Was ist eine Störvariable (SV)?
A: Variable, die zusätzlich zur UV Einfluss auf die AV nehmen kann → macht Kausalinterpretation unsicher.
Beispiel: Unterschiedlicher IQ zwischen Gruppen beeinflusst Problemlösefähigkeit unabhängig von Pausen.
Q: (Folie 70–71) Warum reicht Beobachten allein nicht für Kausalität?
Korrelation ≠ Kausalität.
Ohne Manipulation der UV kann man Störvariablen nicht kontrollieren.
Reine Beobachtungen sind anfällig für unbekannte Einflüsse. 💡 Bild: Zwei Linien steigen gleichzeitig – könnte Zufall sein, ohne Ursache-Wirkung.
Q: (Folie 72) Was ist ein Versuchsplan?
A: Konkrete Handlungsanweisung zur Datenerhebung, um Hypothesen effizient, valide und präzise zu prüfen.
📍 Enthält: Welche Gruppen, Bedingungen, Messungen & Reihenfolgen es gibt.
Q: (Folie 73–74) Was ist ein Zwischengruppen-Design (between-subjects)?
A: Jede Versuchsperson wird nur in einer experimentellen Bedingung getestet.
Beispiel: Gruppe 1 lernt regelmäßig, Gruppe 2 chillt → Vergleich der Klausurnoten.
💡 Bild: Zwei parallele Laufbahnen – jede Person läuft nur auf einer.
Q: (Folie 75–76) Warum braucht ein Experiment zufällige Zuordnung?
A: Damit sich Gruppen nur in der UV unterscheiden – nicht in anderen Merkmalen.
→ Zufall entscheidet, wer in welche Bedingung kommt.
🚫 Ohne Randomisierung → kein echtes Experiment.
Q: (Folie 77) Wozu dient zufällige Zuordnung?
A: Kontrolle systematischer Störvariablen → verhindert, dass andere Faktoren (z. B. Motivation) den Effekt erklären.
💡 Randomisierung = einzige Methode, um alle potenziellen Störfaktoren gleichzeitig auszugleichen.
Q: (Folie 78–79) Wann ist Kausalität ableitbar?
A: Nur wenn Unterschiede in der AV auf die manipulierte UV zurückgeführt werden können → geht nur mit zufälliger Zuordnung.
Q: (Folie 80) Kann zufällige Zuordnung scheitern?
A: Ja – besonders bei kleinen Stichproben kann der Zufall ungleiche Gruppen erzeugen (z. B. Altersunterschiede).
💡 Je größer die Stichprobe, desto geringer das Risiko.
Q: (Folie 81) Beispiel für ein Zwischengruppen-Design mit Randomisierung?
A: Studie zu Massentierhaltung & Vegetarismus:
UV: Film über Massentierhaltung vs. Fahrstuhlmusik.
AV: Wer nimmt ein Salamibrötchen?
Zufällige Zuweisung zu Gruppen → echte kausale Aussage möglich.
Q: (Folie 82–83) Was ist ein Messwiederholungs-Design (within-subjects)?
A: Jede Versuchsperson durchläuft alle experimentellen Bedingungen.
Beispiel: Alle Studierenden bearbeiten Klausuraufgaben sowohl nach Lernen als auch nach Chillen.
💡 Bild: Ein Läufer läuft nacheinander beide Bahnen.
Q: (Folie 84) Was sind typische Probleme beim Messwiederholungs-Design?
Reihenfolgeeffekte – Leistung hängt von der Abfolge der Bedingungen ab.
Themenunterschiede – manche Inhalte leichter/schwerer. 📍 Lösung: Randomisierte Reihenfolge der Bedingungen für jede Person.
Q: (Folie 85) Wie kann man Reihenfolgeeffekte reduzieren?
A: Ausbalancieren der Reihenfolge: Manche Teilnehmer beginnen mit Bedingung A, andere mit B.
→ Verhindert, dass z. B. Müdigkeit nur eine Gruppe betrifft.
Q: (Folie 86) Was ist ein einfaktorielles Design?
A: Experiment mit genau einer unabhängigen Variable (UV).
→ Kann als Zwischengruppen- oder Messwiederholungs-Design umgesetzt werden.
Q: (Folie 87–88) Was ist ein mehrfaktorielles Design?
A: Experiment mit mehr als einer unabhängigen Variable (UV).
→ Kombination möglich als Zwischengruppen-, Messwiederholungs- oder gemischtes Design.
Beispiel: UV1 = Pausen vs. keine Pausen, UV2 = Vormittags vs. Nachmittags.
Q: (Folie 89) Was ist ein Haupteffekt?
A: Wirkung einer einzelnen UV auf die AV – unabhängig von anderen UVs.
Beispiel: Pausen verbessern Problemlöseleistung, egal zu welcher Tageszeit.
💡 Merksatz: „Haupteffekt = Effekt einer Variable allein.“
Q: (Folie 90) Was ist eine Interaktion?
A: Kombinierte Wirkung von UVs auf AV – der Effekt einer UV hängt von der Ausprägung einer anderen UV ab.
Beispiel: Tageszeit wirkt sich nur ohne Pausen auf Leistung aus.
Q: (Folie 91) Wie erkennt man eine Interaktion?
A: Wenn der Unterschied in der AV zwischen Stufen einer UV nicht gleich für alle Stufen der anderen UV ist.
💡 Bild: Zwei Linien in einem Diagramm, die sich kreuzen oder auseinanderlaufen.
Q: (Folie 92–93) Können UVs mehr als 2 Ausprägungen haben?
A: Ja – jede UV kann beliebig viele Stufen haben (z. B. 0, 1, 5, 8 Pausen).
→ Erhöht Zahl der Gruppen und benötigte Teilnehmerzahl.
Q: (Folie 94) Was ist ein mehrfaktorielles Messwiederholungsdesign?
A: Jede Person durchläuft alle Bedingungen, aber es gibt mehr als eine UV.
Beispiel: Stresstest (vor/nach) × Therapiestatus (vor/nach Therapie).
Q: (Folie 95) Was ist ein gemischtes Design?
A: Kombination aus Messwiederholungs- und Zwischengruppenfaktoren.
Beispiel: Stresstest (vor/nach) × Gruppe (Patienten vs. Kontrollen).
Q: (Folie 96) Was ist der Nachteil vieler UVs im Design?
A: Je mehr UVs, desto mehr Teilnehmer nötig → höherer Zeit- & Kostenaufwand.
📍 Balance zwischen Komplexität & Machbarkeit finden.
Q: (Folie 109) Was ist ein Quasi-Experiment?
A: Versuchsplan wie ein Experiment, aber ohne zufällige Zuordnung zu Gruppen.
→ Alles andere (UV, AV, Kontrolle von Störvariablen) bleibt gleich.
💡 Merksatz: „Fast Experiment – aber der Zufall fehlt.“
Q: (Folie 110) Warum gibt es manchmal keine zufällige Zuordnung?
Organismische UV – feste Merkmale wie Geschlecht, Alter.
Angewandte Forschung – Gruppen vorgegeben (z. B. Filialen, Abteilungen).
Ethische Gründe – z. B. keine zufällige Verweigerung einer notwendigen Therapie.
Q: (Folie 112–113) Was sind Designs mit vorgegebenen Gruppen?
A: Gruppen sind von Natur aus festgelegt (z. B. Abteilungen, Schulklassen, Geschlecht) → keine Randomisierung möglich.
Q: (Folie 114) Was sind Zeitreihendesigns?
A: Eine Gruppe wird mehrfach vor und nach einer Intervention gemessen.
Beispiel: Depressionswerte vor/nach jeder Therapiesitzung.
💡 Vorteil: Verlauf wird sichtbar, auch ohne Kontrollgruppe.
Q: (Folie 115) Was sind Einzelfalldesigns?
A: Untersuchung nur einer Person – oft bei seltenen Fällen oder detaillierten Analysen.
Vorteil: Tiefer Einblick ohne Mittelungseffekte.
Nachteil: Kaum generalisierbar, viele Störvariablen.
Q: (Folie 118) Was ist eine Korrelationsstudie?
A: Nicht-experimentelles Design → misst Richtung & Stärke des Zusammenhangs zwischen ≥ 2 Variablen.
📍 Wichtig: Kein Eingriff, keine Manipulation – nur messen & vergleichen.
Q: (Folie 119) Welche Arten von Zusammenhängen gibt es?
Positiv: beide Variablen steigen/fallen gemeinsam (z. B. Intelligenz ↑ & Ängstlichkeit ↑).
Negativ: eine steigt, die andere sinkt (z. B. Intelligenz ↑ & Ängstlichkeit ↓).
Q: (Folie 120) Was ist der Pearson-Korrelationskoeffizient r?
A: Maß für Stärke & Richtung des Zusammenhangs:
r = +1 → perfekter positiver Zusammenhang.
r = -1 → perfekter negativer Zusammenhang.
r = 0 → kein Zusammenhang.
Q: (Folie 122–123) Warum gilt: „Correlation ≠ Causation“?
A: Zusammenhang heißt nicht, dass X Ursache von Y ist.
→ Oft ist eine dritte Variable Z verantwortlich.
Beispiel: Eiscreme-Verkäufe ↑ & Badeunfälle ↑ → Z = gutes Wetter.
Q: (Folie 124) Worin liegt der Unterschied zu Experiment & Quasi-Experiment?
A: Korrelationsstudie: Keine UV & AV → alle Variablen gleichberechtigt.
Experiment: UV wird manipuliert.
Quasi-Experiment: UV gegeben, aber keine Randomisierung.
Q: (Folie 125) Wann werden Korrelationsstudien genutzt?
Wenn nur Zusammenhänge interessieren (z. B. Test-Validierung).
Wenn Experimente nicht möglich sind (praktisch, ethisch oder theoretisch).
Q: (Folie 126) Was ist eine Korrelationstabelle?
A: Matrix mit Korrelationen zwischen mehreren Variablen.
→ Diagonale = Autokorrelationen (immer r = 1).
→ Meist nur eine Hälfte gefüllt (Spiegelung).
Q: (Folie 127) Beispiel aus der Forschung?
A: Keyte et al. (2021): Mehr Instagram-Nutzung korreliert mit schlechterer mentaler Gesundheit.
Q: (Folie 128) Was sind die Kernaussagen zu Quasi-Experiment & Korrelationsstudie?
Mehrfaktorielle Designs → >1 UV, können Haupteffekte & Interaktionen prüfen.
Quasi-Experiment → wie Experiment, aber keine zufällige Zuordnung; 3 Hauptformen:
Vorgegebene Gruppen
Zeitreihendesign
Einzelfalldesign
Korrelationsstudie → nicht-experimentell, misst Richtung & Stärke eines Zusammenhangs zwischen Variablen (ohne Kausalinterpretation).
Last changeda month ago