Zusammenfassung

Buffl

Versuchsplanung

by Pia-Louisa L.

Womit beschäftigt sich die Psychologie?

Erleben
- nicht beobachtbar
Verhalten
- beobachtbar
- bewusst u. unbewusst
Handeln
- beobachtbar
- bewusstes Verhalten= zielgerichtet

Was macht die Alltagspsychologie?

(verallgemeinernde) Aussagen über Menschen(gruppen) auf Grund von:
- “Bauchgefühl”
- “gesunder Menschenverstand”
- “Lebenserfahrung”
- Wahrnehmung u. Kognition

Was ist Empirie?

methodisch-systematische Sammlung von Daten zum Zweck der Gegenüberstellung von Hypothese u. Realität

Induktion vs. Deduktion

Induktion= Schlussfolgerung vom Einzelfall zum Allgemeinen
Deduktion= Ableitung des Einzelnen vom Allgemeinen

Was ist das Problem bei der Alltagspsychologie?

der Kontext wird teilweise nicht beachtet
kognitive Verzerrungen
Halo-Effekt

Kreislauf in der Wissenschaft von Theorie u. Beobachtung

Müller-Lyer-Illusion

<———>

>———<

welche Linie ist länger?

kognitive Verzerrung

cognitive bias
die systematischen fehlerhaften Neigungen beim
- Wahrnehmen
- Erinnern
- Denken
- Urteilen
Heuristik (Bsp.: Verfügbarkeitsheuristik)

Falsifikationsprinzip

von Karl Popper
Hypothesen sind i.d.R. nicht verifizierbar, sondern nur falsifizierbar
-> aus empirisch gewonnenen Daten kann immer nur induktiv auf eine allgemeine Gesetzmäßigkeit geschlossen werden
-> es kann also nie eine Verifikation (=endgültige Bestätigung) einer Theorie geben
-> deswegen Theorien/ Hypothesen so formulieren, dass sie prinzipiell widerlegbar u. einer empirischen Prüfung zugänglich sind

Was ist Heuristik?

schnelle Lösung für Probleme o. Entscheidungsfindungen (-> “Abkürzungen”)

Verfügbarkeitsheuristik

zur Schlussfolgerung werden bevorzugt Ereignisse herangezogen, die im Gedächtnis der Person besonders leicht verfügbar sind

Halo-Effekt

Urteilsfehler, da eine saliente (=auffallende) Eigenschaft überstrahlt
Bsp.: von Attraktivität wird auf Ehrlichkeit geschlossen

verifizieren

durch Überprüfen, die Richtigkeit/ den Wahrheitsgehalt, einer Sache bestätigen

falsifizieren

eine wissenschaftliche Aussage wird durche empirische Beobachtung/ einen logischen Beweis widerlegt

Ablauf einer empirischen Untersuchung

“Echtes” Experiment

Vergleich von (min.) zwei Bedingungen in Bezug auf eine interessierende Variable
systematische Manipulation einer unabhängigen Variable -> Zuweisung der Stufen der UV zu Bedingungen
Komntrolle von Störvariablen

Was ist empirische Wissenschaft?

ist die methodisch kontrollierte kritische Überprüfung
Ziel: Wissen generieren
- möglichst zuverlässige u. gültige Erkenntnisse
Unterschied zur Alltagspsychologie
- beide haben zwar ähnliche Fragestellungen
- aber: Art u. Weise der Beantwortung unterschiedlich
Anspruch an empirische Wissenschaft
1. Beschreiben
2. Erklären
3. Vorhersagen
4. Verändern

Hypothesen

von Widersprüchen freie, aber zunächst unbewiesene Aussage, Annahme (von Gesetzlichkeiten oder Tatsachen) als Hilfsmittel für wissenschaftliche Erkenntnisse
Typen
- Veränderungshypothese
- Zusammenhangshypothese
- Unterschiedshypothese
Effektgröße
- spezifisch
- unspezifisch
Kausalität
- kausal
- nicht-kausal
Richtung
- gerichtet
- ungerichtet

Variablen

Merkmal o. Eigenschaft
veränderliche Größe
Unabhängige Variable
- Variable, deren Wirkung/ Zusammenhang in Bezug auf AV uns interessiert
- “Ursache”
- Synonyme: Treatment, Faktor, Behandlung
Abhängige Variable
- Variable, auf die durch unsere experimentelle Manipulation eingewirkt wird
- “Effekt”
Störvariablen
- alles was nicht relevant ist für die Studie, aber einen Einfluss nehmen könnte
- personen- u. untersuchungsbezogen

arithmetisches Mittel

Mittelwert/ Durschschnitt

Standardabweichung

zweite Wurzel aus der Varianz
Maß für die Streubreite der werte eines Merkmals rund um dessen Mittelwert

Varianz

mittlere quadrierte Abweichung aller Einzelwerte vom Mittelwert
beschreibt, wie weit die Merkmalsausprägungen vom Mittelwert der Verteilung erntfernt sind

Klassifikation von Versuchsdesigns nach Anzahl der Variablen

UV
- Anzahl UVn
  - 1 UV: einfaktoriell
  - min 2 UV: mehrfaktoriell
- Anzahl Stufen
  - zweistufig (z.B. KG — EG)
  - mehrstufig (z.B. KG — EG1 — EG2)
AV
- Anzahl AV
  - 1 AV: univariat
  - min. 2 AV: multivariat

Welche Versuchspläne gibt es?

between-subject design: Versuchspläne mit Gruppen
within-subject design: Versuchspläne mit Messwiederholungen
between-within-subject design: gemischte Pläne

between-subject design

es gibt meherere Gruppen (Bedingungen) u. jede Vp wird einer Bedingung zugeteilt
- -> erhält z.B. zwei Stufen: Kontrollgruppe u. Experimentalgruppe
UV kann auch >2 Stufen haben -> mehrstufig
Faktorielle Versuchspläne
- AV kann von mehreren UV abhängen
- Haupteffekt
  - = die AV unterscheidet sich zwischen den Stufen eines Faktors (also der Unterschied der gleichen UV in den unterschiedlichen Gruppen)
  - Anzahl der Faktoren= Anzahl der HE
- Interaktionseffekt
  - = der Effekt von Faktor A auf die AV unterscheidet sich zwischen den Stufen von Faktor B
  - bei 2 Faktoren -> Zweifach-Interaktion: Interaktion aus zwei Faktoren -> Linien sind nicht parallel
  - disordinal, ordinal, semidisordinal

within-subject design

es gibt mehrere Bedingungen u. jede Vp ist zugleich in min. 2 (es gibt aber keine unterschiedlichen Gruppen)
-> von jeder Vp liegen min. 2 Messwerte einer AV vor
es gibt keine Kontrollgruppe!!!!!
- z.B. aus ethischen Gründen
Messungen können
- zeitlich nacheinander
- innerhalb einer Aufgabe stattfinden

disordinal, ordinal, semidisordinal

disordinal
- der Unterschied a1 u. a2 innerhalb der Stufe b1, muss ein anderes Vorzeichen haben als der Unterschied a1 u. a2 innerhalb der Stufe b2
- das gleiche muss auch für b1 u. b2 in a gelten
- optisch: in beiden Darstellungen überschneiden sich die Linien
- Interpretation: beide HE dürfen nicht interpretiert werden
ordinal
- der Unterschied a1 u. a2 innerhalb der Stufe b1, muss ein gleiches Vorzeichen haben als der Unterschied a1 u. a2 innerhalb der Stufe b2
- das gleiche muss auch für b1 u. b2 in a gelten
- optisch: keine Überschneidung der Linien (müssen aber auch nicht parallel sein)
- Interpretation: beide HE dürfen interpretiert werden
semidisordinal
- die Unterschiede in einem Faktor haben ein gleiches Vorzeichen u. im anderen Faktor haben die Unterschiede ein unterschiedliches Vorzeichen
- optisch: in einem überkreuzen sich die Linien, im anderen nicht
- Interpretation: HE mit unterschiedlichen Vorzeichen darf nicht interpretiert werden, aber der IE sollte auf jeden Fall auch interpretiert werden.

Wie erkenne ich die Haupteffekt u. Interaktionseffekt in Graphen?

um Haupteffekte ablesen zu können muss ich die Mittelwerte der einzelnen Faktoren bilden
- einmal also innerhalb einer Linie
- einmal zwischen den beiden Linien
um herauszufinden ob ein Interaktionseffekt vorliegt muss ich den Verlauf der Linien anschauen
- nicht parallel -> Interaktionseffekt
- um Interaktionseffekte bei allen Faktoren sehen zu können, müssen alle Faktoren mal auf der x-achse dargestellt werden -> bei 2 Faktoren erhalten wir 2 Darstellungen
  - in beiden keine Überschneidung, aber auch nicht parallel -> ordinal
  - in beiden Überschneidung -> disordinal
  - in einem Überschneidung, in andere nicht -> semidisordinal

between-within-subject design

min. ein within-subject factor (Innersubjektfaktor) u. min. ein between-subject factor (Zwischensubjetfaktor)
- Bsp.:
  - zwei Therapiemethoden -> within-factor (da man zwei Stufen hat)
  - Reihenfolge der Therapiemethoden wird getauscht -> between-factor

evtl. sind KG u. EG nicht vergleichbar (durch kleine Stichproben o. eingeschränkte Randomisierung)
- Lösung
  - Pretest: Messung der AV vor der Manipulation
  - Post-Test: Messung der AV nach der Manipulation

between-subject design

Vor- u. Nachteile

Vorteile
- geringere Konfundierung der Messungen durch externe Faktoren (z.B. ein weiteres Treatment)
- WK, dass Vp sich langweilen o. Ermüdungerscheinungen zeigen ist geringer, da jede Vp Versuch nur einmal durchläuft
Nachteile
- geringere statistische Power (als within-subject designs) -> Grund: Fehlervarianz innerhalb einer Vp kann nicht geschätzt werden
- die Gruppen müssen gleich groß sein -> für jede neue Bedingung braucht man neue Vp -> braucht größere Stichprobe u. dabei muss diese deemografisch repräsentatibel bleiben

within-subject design

Vor- u. Nachteile

Vorteile
- Herausrechnen von interindividuellen Unterschieden
- weniger Vpn benötigt
Nachteile
- Sequenzeffekte: Abfolge der Untersuchungsbedingungen hat Einfluss (z.B. bessere Leistung durch Übung o. schlechtere Leistung durch Ermüdung)
- Lösungen: unterschiedliche Reihenfolgen der Bedingungen
  - vollständiges Ausbalancieren: alle möglichen Reihenfolgen werden hergestellt u. jeder werden gleiche viele Vpn zugeordnet
  - unvollständiges Ausbalancieren (Randomisierung): jede Vp wird per Zufallsprinzip einer Reihenfolge zugeordnet -> Problem: möglich das manche Reihenfolgen durch viele Vpn u. manche durch gar keine repräsentiert werden
  - unvollständiges Ausbalancieren (Lateinisches Quadrat): es wird nur ein bestimmter Teil der möglichen Reihenfolgen realisiert

betweeb-within-subject design

Vor- u. Nachteile

Vorteile
- Pretest/ Post-Test möglich -> Überprüfung ob EG u. KG überhaupt vergleichbar sind -> z.B. bei kleinen/mittelgroßen Stichproben o. eingeschränkter Randomisierung
Nachteil
- Pretest-Effekte (Auswirkungen des Pretests auf den Post-Test)
  - problematisch wenn Interaktion zwischen Pretest-Effekten u. experimenteller Bedingung -> kann die Post-Test-Daten nicht sicher interpretieren
  - Lösung:
    - Solomon 4-Gruppen-Plan: Analyse von den Pretest-Effekten, ABER benötigt größere Stichprobe
    - längeres Intervall zwischen Pretest u. Manipulation
    - Pretest wird in einer Testbatterie “versteckt”

Quasi-Experiment

erfüllt Kriterium 1. u. 2. aber nicht 3. Kontrolle der Störvariablen
nicht-randomisierte kontrollierte Studie
- greift auf vorhandene Gruppen zurück -> keine Randomisierung
- misst die resultierenden Effekte auf die AV in den Gruppen
- aber: experimentelle Manipulation der UV
Prüfung einer Kausalhypothese
Vorteil:
- nicht von untersuchungsbezogenen Störvariblen beeinflusst
Nachteil:
- schächere interne Validität als experimentelle Studie
- personenbezogene Störvariablen

korrelative Studie

Untersuchung der Beziehung zwischen zwei o. mehr Variablen
die Variablen werden nicht manipuliert/ kontrolliert
- nur Kriterum 1. eines “echten” Experiment erfüllt
Zweck
- Test der Stärke der Beziehung zwischen Variablen
Vorteil:
- hohe externe Validität

Querschnittstudie

Untersuchung von Zusammenhängen zwischen Variablen -> deswegen auch “Korrelationsstudie”

“cross-sectional-study”, “Korrelationsstudie”
zu einem Zeitpunkt wird Stichprobe untersucht

Querschnittstudie

Stichprobe wird zu einem Zeitpunkt untersucht
möglich Zusammenhänge zwischen Variablen zu messen -> deswegen auch “Korrelationsstudie” genannt

Längsschnittstudie

Stichprobe wird zu mehreren Zeitpunkten untersucht
- meist über längeren Zeitraum (mehrere Monate/ Jahre)
Vorteile
- Verlaufsmessungen/ Veränderungsmessungen
- höhere interne Validität -> denn der Effekt ist der Ursache zeitlich nachgeordnet

Wann wählt man Querschnittstudie?

wenn Manipulationen nicht möglich sind
Aufdecken der “wahren” Effektstärke
Vergleich von Effektgrößen
Übrprüfung von Assoziatoonen als erster Schritt
Validierung diagnostische Verfahren
Struktur eines Konzepts möglich, indem die Korrelationen mehrere Variablen erfasst werden können

Welche Faktoren beeinflussen den Erfolg einer Korrelationsstudie?

die Reliabilität (Messgenauigkeit) der Variablen
die Varianzen der Variablen in der Stichprobe
- wenn die Varianz eines Merkmals in der Stichprobe eingeschränkt ist -> Unterschätzung der Korrelation u. geringere Power (durch kleineren Effekt)
die Wahl der geeigneten Kontrollvariablen
- statistische Kontrolle von Personen- u. Umgebungsvariablen (können nicht wie im Labor konstant gehalten werden)
- wichtig: theoriegeleitete Auswahl einiger zentraler Variablen

Längsschnittstudie

Designs

Arten
- Retrospektive Studie: simulierter Längsschnitt -> Vpn werden zu ihrer Vergangenheit befragt
- Panel-Studie/ Prospektive Studie: eine Stichprobe wird zu mehreren Messzeitpunkten untersucht
  - cross-lagged-Panel: min. 2 Variablen werden beide zu min. 2 Zeitpunkten betrachtet -> kann mehr Zusammenhänge zwischen Variablen u. Messzeitpunkten herausfinden

Risiken bei der Längsschnittstudie

Testwiederholungseffekte (Übungseffekte)
Regression zur Mitte
Messung der Konstrukte (Anpassung der Messinstrumente)
Reifung der Teilnehmer
Sterblichkeit/ systematische Abbrüche
Externes Geschehen

-> interne Valididität gefährdet

Was ist die Operationalisierung?

“Übersetzung eines wissenschaftlichen Begriffs bzw. eines theoretischen Konstrukst in eine messbare Größe (-> Messbarmachung)
unbeobachtbare theoretische Begriffe einer psychologischen Hypothese werden übersetzt in beobachtbare Variablen einer empirischen Hypothese

Was muss operationalisiert werden?

alle Variablen (jede AV u. jede UV)

Klassifikation von Variablen

Beobachtbarkeit
- latent: nicht direkt beobachtbar -> Messung erfolgt indirekt durch korrespondierende manifeste Variablen
- manifest: direkt beobachtbare Ausprägungen
Zählbarkeit der Ausprägungen
- diskret (diskontinuierlich): abzählbar
- stetig (kontinuierlich): überabzählbare mögliche Ausprägungen in einem Intervall
Skalenniveau
- Nominalskala
- Ordinalskala
- Intervallskala
- Verhältnisskala
- Absolutskala

Nominalskala

Nominalskala
- Klassifikationen u. Kategorien -> Daten können in keine logische Rangordnung gebracht werden (gibt kein besser/ schlechter)
- Variablen sind: -> kategoriale Variablen
  - diskret: keine Zwischenstufen o. Übergänge zwischen den Kategorien
  - qualitativ: Zugehörigkeit zu einer Kategorie (bringen Qualität u. nicht ein Ausmaß zum Ausdruck
  - in Kategorien einteilbar
- Bsp.: Geschlecht, Haarfarbe, Automarke

Ordinalskala

Ordinalskala
- die Kategorien sind durch Rangordnung definiert
- aber die Abstände zwischen den Ausprägungen sind nicht interpretierbar, da sie nicht exakt gleich sind -> nur größer/ kleiner Aussagen
- Variablen sind (-> kategoriale Variablen): diskret, qualitativ, in Kategorien einteilbar UND in Rangordnung zu bringen
- Bsp.: Schulnoten (da die zu erreichenden Punkte unterschiedliche Abstände haben), Bildungsstand, militärische Ränge, Wettkämpfe

Intervallskala

Intervallskala -> ab hier metrische Skala (Kardinalskala)
- Kategorien, Rangordnung u. Abstände sind definiert (kein natürlicher Nullpunkt)
- Variablen sind -> metrische Variablen
  - stetig: unendliche viele Zwischenstufen
  - quantitativ: gibt Aussage über das Ausmaß bzw die Ausprägung
  - in Kategorien eingeteilt, in Rangordnung u. Abstände immer gleich!!!
- Bsp.: Temperatur in °C, IQ, alle psychologischen Konstrukte (Geduld, Fremdenfeindlichkeit, Empathie, Durchhaltevermögen,…)

Verhätnisskala

Verhältnisskala
- Rangordnung, Abstände u. natürlicher Nullpunkt sind definiert
- Variablen sind: stetig, quantitativ, ….
- Bsp.: Reaktionsgeschwindigkeit, Gehalt, Gewicht, Alter, Körpergröße, Kelvin-Temperaturskala

Absolutskala

Absolutskala
- Rangordnung, Abstände, natürlicher Nullpunkt u. natürliche Einheit sind definiert
- Variablen sind:
  - stetig (manche Lehrbücher sagen sie ist diskret)
  - quantitativ
  - in Kategorien einteilbar
  - in gleiche Abstände zu bringen
  - in den Merkmalsausprägungen gibt es natürlichen Nullpunkt
  - natürliche Einheit (kann eine Anzahl angeben)
- Bsp: Anzahl an Fachsemestern, Verhaltensbeobachtung (Anzahl an Verlegenheitsgesten)

Gütekriterien der Variablen

Objektivität
Reliabilität
Validität

Objektivität

Grad der Unabhängigkeit des Testergebnisses von…
- der Person, die Test mit Vpn durchführt (Durchführungsobjektivität)
- der Person, die den Test auswertet (Auswertungsobejktivität)
- der Person, die den Test interpretiert (Interpretationsobjektivität)

Reliabilität

Genauigkeit mit der das Merkmal gemessen wird
je kleiner der Messfehler, desto reliabler
Störeinflüsse: situative Störungen, Müdigkeit der Vpn, Missverständnisse

Validität

Grad für die Güte eines Tests/ Messung
- Grad der Übereinstimmung des gemessenen Merkmals mit dem intendierten Merkmal
- “misst der Test was er soll?”
- Formen
  - interne Validität: sind die Ergebnisse kausal interpretierbar
    - Augenscheinvalidität: auch für Laien ist erkennbar, welche Merkmale durch den Test erfasst werden sollen
  - externe Validität: sind die Ergebnisse generalisierbar
    - Konstruktvalidität: aus Definition eines Konstrukt wird abgeleitet, mit welchen anderen Maßen der Test hohe, geringe, keine Korrelation
    - Kriteriumsvalidität: Festlegung mit welchen manifesten Merkmaken der Test korrelieren soll
  - statistische Validität: sind die statistischen Verfahren korrekt angewendet worden

Welche Datenquellen gibt es?

Befragung
Beobachtung
Test
Apparative Techniken

Befragung

wie aufgebaut?
- Art des Kontaktes: persönlich, telefonisch, schriftlich
- Grad der Strukturierung: strukturiert: wenig, teil, stark
- Anazhl der Befragten: Einzel- vs Gruppenbefragung
Items
- Formulierung beachten
- gerade genug Items um Variable abzubilden
- Inhalts- vs Funktionsitems (Distraktor-, Eisbrecher-, Filteritems)
- offen, geschlosse, quasi-geschlossen
- Skala
  - Numeral-, Verbal-, Symbol-, graphische Skala
  - uni- vs bipolar gepolt
  - gibt es neutrale Mitte?

Beobachtung

Selbst- vs Fremdbeobachtung
offen vs verdeckt
teilnehmend vs nicht-teilnehmend
direkt vs indirekt (non-reaktiv)

Tests

Persönlichkeitstests:
- keine objektive Beurteilung der Antworten möglich
- subjektive: Selbstauskunft
- objektiv: Messintention ist verborgen
Leistungstests:
- eindeutig richtig u. falsche Antworten
- z.B. Intelligenztest

Apparative Messungen

Reaktionszeit-Messungen
Physiologische Messungen

Wie sollten Inhaltsitems formuliert sein?

klar u. deutlich
kurz u. prägnant -> keine langen Sätze (Überforderug)
einfache Sprache
keine doppelten Verneinungen
die Frage soll keine Antwort suggerieren
pro Item nur eine Information abfragen
wenn Zeitangaben nötig sind: konkrete Zeitangaben o. klar definierte Zeitangaben beinhalten

Population

Grundgesamtheit
Gesamtheit aller Fälle, über die in einer Studie wissenschaftlich etwas ausgesagt werden soll

Stichproben

Teil der Grundgesamtheit (der nach einem bestimmten Auswahlverfahren zustande gekommen ist= Stichprobenziehung)
Zufallsstichproben
- einfache Zufallsauswahl
- systematische Zufallsauswahl
- geschichtete Zufallsstichprobe
- Klumpenstichprobe
- mehrstufige Zufallsstichprobe
Stichproben ohne Zufallsauswahl
- Gelegenheitsstichprobe
- Quotenstichprobe
- Schneeballstichprobe
- theoretische Stichprobe

Planung der Durchführung

Wer wird zur Teilnahme eingeladen?
- Definition Grundgesamtheit
- Festlegung der Stichprobenart
- Stichprobenumfangsplanung
Wie werden die Vpn eingeladen?
- Aushang/ Flyer
- SONA
Was wird benötigt?
- Experimentalprogramme
- Apparate (PCs, Eyetracker..)
- Süßigkeiten, Geld
- Ordner mit allen Dokumenten: Einverständniserklörung, Debriefing, Quittungsliste, Fragebögen, Ablaufplan mit Regeln für das Verhalten der Vl
Wann wird erhoben?
- Semsterferien vs Vorlesungszeit
Wo wird erhoben?
- Online vs Labor

Planung der Auswertung

Auswertungsverfahren festlegen
- ergibt sich aus Untersuchungsdesign, Skalenniveau der Variablen u. der Voraussetzung der Tests
Auswahl einer Software
- SPSS, R, …
Erstellung eines Beispieldatensatzes
- selber mehrmals mit verschiedenen Angaben teilnehmen o. Pilotstudie
- Skript zum Datenmanagement u. Datenaufbereitung vorbereiten
Analyseverfahren anwenden
- Überprüfung, ob man alle Variablen erhebt, die wichtig sind
- Fragestellung wirklich mit den erhobenen Variablen untersuchbar?
Interpretation möglicher Ergebnisse
- gibt es konfundierende Variablen?
- sollten weitere Variablen als Kontrollvariablen erhoben werden?

Was gehört in ein Exposé?

Titel, 1. u. 2. Prüfer
Kontaktangaben der Studierenden
Ziele u. Fragestellung sowie kurze Herleitung
Überlegungen zum methodischen Vorgehen bei der Bearbeitung der Fragestellung
konkrete Planung der Erhebung von Daten
- bei empirischen Arbeiten: Versuchspersonen, Design, Vorgehen, Instrumente…
Arbeitsplanung mit Zeitplan

Störvariablen

alle Größen die die AV beeinflussen, aber in der geplanten Studie nicht von Interesse sind
Einfluss
- mit UV konfundiert -> systematischer Fehler
- nicht mit UV konfundiert -> zufälliger Fehler
Art
- personenbezogene
  - Unterschiede bzgl. stabiler Merkmale der Vpn
- untersuchungsbezogene
  - Unterschiede bzgl. Ort/ Zeit/ Versuchsleiter
  - motivated reasoning
  - Reaktivität

Kontrolle von Störvariablen

beide
- Konstanthaltung:
  - U: konstante Rahmenbedingungen, Abfolge, standardisierte Instruktionen
  - P: möglichst gleiche Ausprägung in allen Gruppen
- systematische Variation: Verwendung einer weiteren UV -> Analyse HE u. IE
- Registrierung: potentielle Störvariablen miterheben
Personenbezogene
- Randomisierung: zufällige Zuteilung der Vpn zu den Versuchsbedingungen der UV
- Parallelisierung/ Matching:
  - P: potentielle Störvariable soll in allen Gruppen ähnlichen Mittelwert, Varianz haben
  - M: Bildung von Vpn Paaren mit ähnlicher Ausprägung im Merkmal, die dann randomisiert in die Gruppen eingeteilt werden
untersuchungsbezogene
- Elimination: Einflüsse potentieller Störv. werden ausgeschlossen
- Einfachblind: Vp kennt Hypothese nicht
- Doppelblind: Vp u. Vl kennen Hypothese nicht u. nicht in welcher Bedingung Vp ist

Forschungsethik vs Wissenschaftsethik

Forschungsethik: Schutz von Würde u. Wohlergehen der Vpn
- durch ethischen Umgang mit Versuchspersonen
  - Freiweilligkeit u. informierte Einwilligung (Inventivierung, informed consent, Täuschung u. Debriefing)
  - Schutz vor Beeinträchtigung u. Schädigung
  - Anonymisierung u. Vertraulichkeit der Daten
- allgemeine Richtlinien in der Psychologie (APA, DGP, BDP)
Wissenschaftsethik: Orientierung von wissenschaftlichem Erkenntnisgewinn an den Regeln guter wissenschaftlicher Praxis

Was ist Open Science?

offene/ transparente Wissenschaft, Prinzipien u. Methoden
die der Transparenz u. Replizierbarkeit publizierter psychologischer Befunde u. somit der Qualitätssicherung psychologischer Forschung dienen
durch die Replikationskrise hat sie an Bedeutung gewonnen

Replikationskrise

methodische Krise (über mehrere Fachbereiche)
eine Vielzahl an Studien kann nicht durch Replikation bestätigt werden

Maße für Verlässlichkeit von Befunden

Reproduzierbarkeit: Verwendung der gleichen Daten u. der gleichen Analysestrategie
Robustheit: Verwendung der gleichen Daten aber andere Analysestrategie
Repliziebarkeit: Befund wird mit unterschiedlichen Daten (als die Originaldaten) geprüft

Was beinhaltet alles die Open Science?

Open Data: freier Zugang zu wissenschaftlichen Daten
Open Access: freier Zugriff zu Fachartikeln in Zeitschriften
Open Methodology: Zugriff auf Forschungsmethoden u. Material + a priori Hypothesen u. ursprünglich geplante Analyseverfahren
Open Source: freier Zugang zu Software u. Computer coded
Open Peer Review: frei zugängliche Reviews einsehen können

Qualitative Forschung

Kategorien entwickeln

deduktiv
- Kategorien im Vorhinein festgelegt
- basierend auf Vorwissen
- Textinhalte werden daraufhin zugeordnet
induktiv
- beim Lesen/ Hören des Textes werden die Kategorien entwickelt
- Schlüsselfrage: durch welche Kategorie wird diese Textstelle sinnvoll abgebildet?
deduktiv-indukitv
- einige Kategorien werden im Vorhinein auf Basis von Vorwissen abgeleitet
- andere werden bei der Betrachtung des Materials entwickelt

Bestätigungsfehler

Neigung von Menschen, Informationen so auszuwählen, zu suchen u. zu interpretieren, dass diese die eigenen Erwartungen bestätigen

Pretest

Messung der AV vor der Manipulation
evtl. sind KG u. EG nicht vergleichbar -> unterschiedliche Ausgangsbedingungen
-> kann zu einer falschen Interpretation der Ergebnisse führen

Solomon 4- Gruppen Plan

Überprüfung möglicher Wirkungen von Pretest-Effekten
4 Gruppen:
- 2 mit Pretest (jeweils Beidngung 1 u. 2)
- 2 ohne Pretest (jeweils Bedingung 1 u. 2)
- alle Posttest

Haupteffekt

die AV unterscheidet sich zwischen den Stufen eines Faktors
Anzahl Faktoren= Anzahl HE

Interaktionseffekt

der Effekt von Faktor A auf die AV unterscheidet sich zwischen den Stufen von Faktor B
disordinal, ordinal, semi-disordinal
n! / k! x (n-k)! = (n über k)

Bestimmung der Reliabilität

Retest-Reliabilität (Stabilität):
- Test-Retest-Korrelation (Test wird 2x durchgeführt) -> je höher, desto reliabler
- Stabilität= Test-Retest-Korrelation über längere Zeitspanne
- je länger die Zeitspanne, desto geringer die Retest-Reliabilität
- nur bei “stabilen” Konstrukten (nicht bei veränderlichen Merkmalen)
Paralleltest-Reliabilität (Äquivalenz):
- zwei Versionen eines Messinstruments werden getestet, die dasselbe Merkmal messen (gleiche Vpn durchlaufen erst die eine dann die andere Version)
- Anwendung wenn erneute Testung durch Testwiederholungseffekte verzerrt werden würde
- Korrelation von zwei Testversionen
interne Konsistenz
- Grundannahme: jedes Item soll das (gleiche) Konstrukt abbilden
  - durch viele ähnliche Items werden die Messfehler, der einzelnen Items gemittelt
  - je mehr Items ein Fragebogen -> desto reliabler
  - Messungen: Testhalbierungs-Reliabilität u. Cronbachs Alpha
Wertebereich: 0 bis 1
- >0,7: akzeptable Reliabilität
- >0,8: gute Reliabilität
- >0,9: sehr gute Reliabilität

einfache Zufallsstichprobe

jedes Mitglied der Population hat gleiche WK in die Stichprobe aufgenommen zu werden
Voraussetzung: Population ist bekannt

sytematische Zufallstichprobe

z.b. jedes 5. Element der Population wird ausgewählt
Vorteil: einfach zu realisieren u, bei infiniten Populationen anwendbar
Nachteil: nicht völlig zuföllig, problematisch wenn Elemente in der Populationsliste nach Kriterium geordnet

geschichtete Zufallstichprobe

Bildung der Schichten nach mehreren Dimensionen
- Merkmalsausprägungen definieren Schichten (Strata) der Population
- für jede Schicht wird eigene Stichprobe erhoben
Formen
- proportional: die relative Größe der Schichten in der Stichprobe entspricht den relativen Größen der Schichten in der Population -> nur proportionale sind repräsentativ (relativen Größen in der Strata müssen bekannt sein)
- disproportional: keine Äquivalenz der Häufigkeiten -> genauere Beschreibung von Minderheiten, imdem sie überrepräsentiert werden
Vorteil:
- insbesondere wenn Merkmale mit dem zu untersuchenden Merkmal hoch korrelieren, wird dadruch eine exakte Schätzung möglich
- Repräsentativität bestimmter Merkmale ist gewährleistet

Repräsentativität

Stichprobe ist repräsentativ wenn sie die gleiche Zusammensetzung wie die Population hat

Welche Zufallstichproben garantieren repräsentativität?

einfache u, systemische nicht
mit geschichteten Zufallsstichproben wird die Repräsentativität für bestimmte Merkmale gewährleistet

Klumpenstichprobe

Gesamtheit besteht aus vielen natürlichen Teilpopulationen
-> zufällige Auswahl von Klumpen wird vollständig erhoben
Bsp: Schulklassen
Vorteil: es wird kein Gesamtregister für alle Populationsmitglieder gebraucht
bessere Schätzung der Populationsparameter wenn
- mehr Klumpen gezogen werden
- die Klumpen untereinander ähnlich sind
- die Klumpen in sich heterogen sind

mehrstufige Zufallsstichprobe

auf verschiedenen Ebenen werden hierarchisch untergeordnete Teilstichproben ausgewählt
Bsp.: 3-Stufige Stichprobe
- Zufallsauwahl Uni
- Zufallsauswahl Studiengang
- Zufallsauswahl Studierende

Gelegenheitsstichprobe

Probanden werden ausschließlich nach Verfügbarkeit ausgwählt

Quotenstichprobe

in einer Gelegenheitsstichprobe sollen bestimmte Quoten erfüllt werden
die Quotenstichprobe muss sich nicht an den Populationsanteilen orientieren
Bsp: 5% Arbeitslose

Schneeballstichprobe

Mitglieder einer Population werden gebeten, über soziale Netzwerke weitere Vpn zu rekrutieren
Vorteil:
- bei schwer erreichbaren Populationen
- wenn Mitglieder der Population gut vernetzt

theoretische Stichprobe

Vpn werden theoriegeleitet nach dem Ziel der Studie ausgewählt
- (eher in der qualitativen Forschung)
Abbruchkriterium: “theoretische Sättigung”

Vor- und Nachteile willkürliche Stichproben

Vorteil
- praktikabel
- kostengünstig
Nachteil
- eingeschränkte Repräsentativität
- verzerrte Populationsparameter (Mittelwert, Varianz)

Wann sind willkürliche Stichproben akzeptabel und wann sind sie probelmatisch?

problematisch, wenn
- konkrete Merkmalsausprägungen bestimmt werden sollen (z.B. Parteipräferenzen für Wahlprognose)
- Einfluss der Bevölkerungsschicht auf Zusammenhänge
akzeptabel, wenn
- die absoluten Merkmalsausprägungen unwichtig sind
- es unplausibel ist, dass sich Zusammenhänge zwischen den Bevölkerungsschichten grundsätzlich unterscheiden

Kontrolle von Störvariablen bei der Auswertung

Ausschluss von Vpn, bei denen Besonderheiten auftraten
separate Analysen für verschiedene Gruppen
potentielle Störvariable wird als weiterer Faktor in die Analyse aufgenommen
- -> mögliche kein HE aber IE
Aufnahme als Kovariante (Kontrollvariable) -> Herausrechnen der Variable

motivated reasoning

Versuchsleitung macht systematische Fehler bei der Datenaufzeichnung, die die Hypothese stützen

Reaktivität

Vpn ändern ihr Verhalten, weil sie untersicht werden (unabhängig vom eigentlichen Treatment)
Arten
- Hawthorne-Effekt
- Placebo-Effekt
- Bewertungsangst
- Vermutungen über die Hypothese
  - Demand-Effekte
  - reaktantes Verhalten
- Rosenthal-Effekt
- “der kluge Hans”
- soziale Erwünschtheit

Hawthorne-Effekt

Vpn ändern ihr Verhalten, weil sie wissen, dass sie an einer Studie teilnehmen u, unter Beobachtung stehen

Placebo-Effekt

Wirkung eines Medikaments/ Treatments, weil die Betroffenen glauben, dass das Medikament/ Treatment wirkt
zwei (potentielle) Wirkungen
- medizinisch: der Wirkstoff
- psychologisch: Glaube an die Wirksamkeit

Bewertungsangst

führt zu schlechterer Leistung

Vermutungen über die Hypothese

v.a. bei Psychologiestudenten
Demand-Effekte
- Vpn wollen hilfreich u. nett sein v.a. wenn sie Vl persönlich kennen
reaktantes Verhalten
- hypothesenkonträres Verhalten

soziale Erwünschtheit

Tendenz, Selbstauskunftsfargen (in Interviews, Fragebögen, Persönlichkeitstest) entsprechend der sozialen Norm u. Erwartungen zu beantworten
stattt dem realen Erleben u. Verhalten

der kluge Hans

Versuchsleiter-Erwartungseffekt
unbewusste Beeinflussung des Verhaltens von Vpn/ Versuchstieren durch die eigene Erwarungshaltung, die das Experiment in die erhoffte Richtung lenken

Rosenthal-Effekt

Versuchsleiter-Erwarungseffekt
die Erwarungen der Versuchsleitung beeinflussen das Verhalten der Vpn

ethisch fragwürdige Untersuchungen

Stanford Prison Experiment
- UV: Rolle (Häftliche u. Wärter)
- AV: Verhalten in Gefägnissituation
- Ergebnisse:
  - Anonymität u. Deindividuation
  - Macht der Regeln u. Vorschriften
  - Rollenidentifikation u. Verantwortung für Übertretung
  - kognitive Dissonanz
  - Bedürfnis sozialer Anerkennung
Monster Studie

ab wann sind Prinzipien der Forschungsethik verletzt?

Freiwilligkeit u. informierte Teilnahme
- Incentivierung
- informed consent
- Täuschung u. Debriefing
Schutz vor Beeinträchtigung u. Schädigung
Anonymisierung u. Vertraulichkeit der Daten

Inhalt informed consent

wahrheitsgemäße Angabe zu Zweck, Dauer u. Vorgehen der Studie
Informationen über Bonus für Teilnahme
Informationen, dass die Teilnahme zu jedem Zeitpunkt abgebrochen werden kann
Konsequenz der Nicht-Teilnahme o. vorzeitigen Beendigung
Möglichkeit der Datenlöschung am Ende der Studie
Gewährleistung von Vertraulichkeit u. Anonymität
Kontaktadressen bei Fragen
möglicher Nutzen
mögliche Beeinträchtigungen

Join Course

Preview

Author

Pia-Louisa L.

Information

Last changed
3 years ago

Report course