Womit beschäftigt sich die Psychologie?
Erleben
nicht beobachtbar
Verhalten
beobachtbar
bewusst u. unbewusst
Handeln
bewusstes Verhalten= zielgerichtet
Was macht die Alltagspsychologie?
(verallgemeinernde) Aussagen über Menschen(gruppen) auf Grund von:
“Bauchgefühl”
“gesunder Menschenverstand”
“Lebenserfahrung”
Wahrnehmung u. Kognition
Was ist Empirie?
methodisch-systematische Sammlung von Daten zum Zweck der Gegenüberstellung von Hypothese u. Realität
Induktion vs. Deduktion
Induktion= Schlussfolgerung vom Einzelfall zum Allgemeinen
Deduktion= Ableitung des Einzelnen vom Allgemeinen
Was ist das Problem bei der Alltagspsychologie?
der Kontext wird teilweise nicht beachtet
kognitive Verzerrungen
Halo-Effekt
Kreislauf in der Wissenschaft von Theorie u. Beobachtung
Müller-Lyer-Illusion
<———>
>———<
welche Linie ist länger?
kognitive Verzerrung
cognitive bias
die systematischen fehlerhaften Neigungen beim
Wahrnehmen
Erinnern
Denken
Urteilen
Heuristik (Bsp.: Verfügbarkeitsheuristik)
Falsifikationsprinzip
von Karl Popper
Hypothesen sind i.d.R. nicht verifizierbar, sondern nur falsifizierbar
-> aus empirisch gewonnenen Daten kann immer nur induktiv auf eine allgemeine Gesetzmäßigkeit geschlossen werden
-> es kann also nie eine Verifikation (=endgültige Bestätigung) einer Theorie geben
-> deswegen Theorien/ Hypothesen so formulieren, dass sie prinzipiell widerlegbar u. einer empirischen Prüfung zugänglich sind
Was ist Heuristik?
schnelle Lösung für Probleme o. Entscheidungsfindungen (-> “Abkürzungen”)
Verfügbarkeitsheuristik
zur Schlussfolgerung werden bevorzugt Ereignisse herangezogen, die im Gedächtnis der Person besonders leicht verfügbar sind
Urteilsfehler, da eine saliente (=auffallende) Eigenschaft überstrahlt
Bsp.: von Attraktivität wird auf Ehrlichkeit geschlossen
verifizieren
durch Überprüfen, die Richtigkeit/ den Wahrheitsgehalt, einer Sache bestätigen
falsifizieren
eine wissenschaftliche Aussage wird durche empirische Beobachtung/ einen logischen Beweis widerlegt
Ablauf einer empirischen Untersuchung
“Echtes” Experiment
Vergleich von (min.) zwei Bedingungen in Bezug auf eine interessierende Variable
systematische Manipulation einer unabhängigen Variable -> Zuweisung der Stufen der UV zu Bedingungen
Komntrolle von Störvariablen
Was ist empirische Wissenschaft?
ist die methodisch kontrollierte kritische Überprüfung
Ziel: Wissen generieren
möglichst zuverlässige u. gültige Erkenntnisse
Unterschied zur Alltagspsychologie
beide haben zwar ähnliche Fragestellungen
aber: Art u. Weise der Beantwortung unterschiedlich
Anspruch an empirische Wissenschaft
Beschreiben
Erklären
Vorhersagen
Verändern
Hypothesen
von Widersprüchen freie, aber zunächst unbewiesene Aussage, Annahme (von Gesetzlichkeiten oder Tatsachen) als Hilfsmittel für wissenschaftliche Erkenntnisse
Typen
Veränderungshypothese
Zusammenhangshypothese
Unterschiedshypothese
Effektgröße
spezifisch
unspezifisch
Kausalität
kausal
nicht-kausal
Richtung
gerichtet
ungerichtet
Variablen
Merkmal o. Eigenschaft
veränderliche Größe
Unabhängige Variable
Variable, deren Wirkung/ Zusammenhang in Bezug auf AV uns interessiert
“Ursache”
Synonyme: Treatment, Faktor, Behandlung
Abhängige Variable
Variable, auf die durch unsere experimentelle Manipulation eingewirkt wird
“Effekt”
Störvariablen
alles was nicht relevant ist für die Studie, aber einen Einfluss nehmen könnte
personen- u. untersuchungsbezogen
arithmetisches Mittel
Mittelwert/ Durschschnitt
Standardabweichung
zweite Wurzel aus der Varianz
Maß für die Streubreite der werte eines Merkmals rund um dessen Mittelwert
Varianz
mittlere quadrierte Abweichung aller Einzelwerte vom Mittelwert
beschreibt, wie weit die Merkmalsausprägungen vom Mittelwert der Verteilung erntfernt sind
Klassifikation von Versuchsdesigns nach Anzahl der Variablen
UV
Anzahl UVn
1 UV: einfaktoriell
min 2 UV: mehrfaktoriell
Anzahl Stufen
zweistufig (z.B. KG — EG)
mehrstufig (z.B. KG — EG1 — EG2)
AV
Anzahl AV
1 AV: univariat
min. 2 AV: multivariat
Welche Versuchspläne gibt es?
between-subject design: Versuchspläne mit Gruppen
within-subject design: Versuchspläne mit Messwiederholungen
between-within-subject design: gemischte Pläne
between-subject design
es gibt meherere Gruppen (Bedingungen) u. jede Vp wird einer Bedingung zugeteilt
-> erhält z.B. zwei Stufen: Kontrollgruppe u. Experimentalgruppe
UV kann auch >2 Stufen haben -> mehrstufig
Faktorielle Versuchspläne
AV kann von mehreren UV abhängen
Haupteffekt
= die AV unterscheidet sich zwischen den Stufen eines Faktors (also der Unterschied der gleichen UV in den unterschiedlichen Gruppen)
Anzahl der Faktoren= Anzahl der HE
Interaktionseffekt
= der Effekt von Faktor A auf die AV unterscheidet sich zwischen den Stufen von Faktor B
bei 2 Faktoren -> Zweifach-Interaktion: Interaktion aus zwei Faktoren -> Linien sind nicht parallel
disordinal, ordinal, semidisordinal
within-subject design
es gibt mehrere Bedingungen u. jede Vp ist zugleich in min. 2 (es gibt aber keine unterschiedlichen Gruppen)
-> von jeder Vp liegen min. 2 Messwerte einer AV vor
es gibt keine Kontrollgruppe!!!!!
z.B. aus ethischen Gründen
Messungen können
zeitlich nacheinander
innerhalb einer Aufgabe stattfinden
disordinal
der Unterschied a1 u. a2 innerhalb der Stufe b1, muss ein anderes Vorzeichen haben als der Unterschied a1 u. a2 innerhalb der Stufe b2
das gleiche muss auch für b1 u. b2 in a gelten
optisch: in beiden Darstellungen überschneiden sich die Linien
Interpretation: beide HE dürfen nicht interpretiert werden
ordinal
der Unterschied a1 u. a2 innerhalb der Stufe b1, muss ein gleiches Vorzeichen haben als der Unterschied a1 u. a2 innerhalb der Stufe b2
optisch: keine Überschneidung der Linien (müssen aber auch nicht parallel sein)
Interpretation: beide HE dürfen interpretiert werden
semidisordinal
die Unterschiede in einem Faktor haben ein gleiches Vorzeichen u. im anderen Faktor haben die Unterschiede ein unterschiedliches Vorzeichen
optisch: in einem überkreuzen sich die Linien, im anderen nicht
Interpretation: HE mit unterschiedlichen Vorzeichen darf nicht interpretiert werden, aber der IE sollte auf jeden Fall auch interpretiert werden.
Wie erkenne ich die Haupteffekt u. Interaktionseffekt in Graphen?
um Haupteffekte ablesen zu können muss ich die Mittelwerte der einzelnen Faktoren bilden
einmal also innerhalb einer Linie
einmal zwischen den beiden Linien
um herauszufinden ob ein Interaktionseffekt vorliegt muss ich den Verlauf der Linien anschauen
nicht parallel -> Interaktionseffekt
um Interaktionseffekte bei allen Faktoren sehen zu können, müssen alle Faktoren mal auf der x-achse dargestellt werden -> bei 2 Faktoren erhalten wir 2 Darstellungen
in beiden keine Überschneidung, aber auch nicht parallel -> ordinal
in beiden Überschneidung -> disordinal
in einem Überschneidung, in andere nicht -> semidisordinal
between-within-subject design
min. ein within-subject factor (Innersubjektfaktor) u. min. ein between-subject factor (Zwischensubjetfaktor)
Bsp.:
zwei Therapiemethoden -> within-factor (da man zwei Stufen hat)
Reihenfolge der Therapiemethoden wird getauscht -> between-factor
evtl. sind KG u. EG nicht vergleichbar (durch kleine Stichproben o. eingeschränkte Randomisierung)
Lösung
Pretest: Messung der AV vor der Manipulation
Post-Test: Messung der AV nach der Manipulation
Vor- u. Nachteile
Vorteile
geringere Konfundierung der Messungen durch externe Faktoren (z.B. ein weiteres Treatment)
WK, dass Vp sich langweilen o. Ermüdungerscheinungen zeigen ist geringer, da jede Vp Versuch nur einmal durchläuft
Nachteile
geringere statistische Power (als within-subject designs) -> Grund: Fehlervarianz innerhalb einer Vp kann nicht geschätzt werden
die Gruppen müssen gleich groß sein -> für jede neue Bedingung braucht man neue Vp -> braucht größere Stichprobe u. dabei muss diese deemografisch repräsentatibel bleiben
Herausrechnen von interindividuellen Unterschieden
weniger Vpn benötigt
Sequenzeffekte: Abfolge der Untersuchungsbedingungen hat Einfluss (z.B. bessere Leistung durch Übung o. schlechtere Leistung durch Ermüdung)
Lösungen: unterschiedliche Reihenfolgen der Bedingungen
vollständiges Ausbalancieren: alle möglichen Reihenfolgen werden hergestellt u. jeder werden gleiche viele Vpn zugeordnet
unvollständiges Ausbalancieren (Randomisierung): jede Vp wird per Zufallsprinzip einer Reihenfolge zugeordnet -> Problem: möglich das manche Reihenfolgen durch viele Vpn u. manche durch gar keine repräsentiert werden
unvollständiges Ausbalancieren (Lateinisches Quadrat): es wird nur ein bestimmter Teil der möglichen Reihenfolgen realisiert
betweeb-within-subject design
Pretest/ Post-Test möglich -> Überprüfung ob EG u. KG überhaupt vergleichbar sind -> z.B. bei kleinen/mittelgroßen Stichproben o. eingeschränkter Randomisierung
Nachteil
Pretest-Effekte (Auswirkungen des Pretests auf den Post-Test)
problematisch wenn Interaktion zwischen Pretest-Effekten u. experimenteller Bedingung -> kann die Post-Test-Daten nicht sicher interpretieren
Lösung:
Solomon 4-Gruppen-Plan: Analyse von den Pretest-Effekten, ABER benötigt größere Stichprobe
längeres Intervall zwischen Pretest u. Manipulation
Pretest wird in einer Testbatterie “versteckt”
Quasi-Experiment
erfüllt Kriterium 1. u. 2. aber nicht 3. Kontrolle der Störvariablen
nicht-randomisierte kontrollierte Studie
greift auf vorhandene Gruppen zurück -> keine Randomisierung
misst die resultierenden Effekte auf die AV in den Gruppen
aber: experimentelle Manipulation der UV
Prüfung einer Kausalhypothese
Vorteil:
nicht von untersuchungsbezogenen Störvariblen beeinflusst
Nachteil:
schächere interne Validität als experimentelle Studie
personenbezogene Störvariablen
korrelative Studie
Untersuchung der Beziehung zwischen zwei o. mehr Variablen
die Variablen werden nicht manipuliert/ kontrolliert
nur Kriterum 1. eines “echten” Experiment erfüllt
Zweck
Test der Stärke der Beziehung zwischen Variablen
hohe externe Validität
Querschnittstudie
Untersuchung von Zusammenhängen zwischen Variablen -> deswegen auch “Korrelationsstudie”
“cross-sectional-study”, “Korrelationsstudie”
zu einem Zeitpunkt wird Stichprobe untersucht
Stichprobe wird zu einem Zeitpunkt untersucht
möglich Zusammenhänge zwischen Variablen zu messen -> deswegen auch “Korrelationsstudie” genannt
Längsschnittstudie
Stichprobe wird zu mehreren Zeitpunkten untersucht
meist über längeren Zeitraum (mehrere Monate/ Jahre)
Verlaufsmessungen/ Veränderungsmessungen
höhere interne Validität -> denn der Effekt ist der Ursache zeitlich nachgeordnet
Wann wählt man Querschnittstudie?
wenn Manipulationen nicht möglich sind
Aufdecken der “wahren” Effektstärke
Vergleich von Effektgrößen
Übrprüfung von Assoziatoonen als erster Schritt
Validierung diagnostische Verfahren
Struktur eines Konzepts möglich, indem die Korrelationen mehrere Variablen erfasst werden können
Welche Faktoren beeinflussen den Erfolg einer Korrelationsstudie?
die Reliabilität (Messgenauigkeit) der Variablen
die Varianzen der Variablen in der Stichprobe
wenn die Varianz eines Merkmals in der Stichprobe eingeschränkt ist -> Unterschätzung der Korrelation u. geringere Power (durch kleineren Effekt)
die Wahl der geeigneten Kontrollvariablen
statistische Kontrolle von Personen- u. Umgebungsvariablen (können nicht wie im Labor konstant gehalten werden)
wichtig: theoriegeleitete Auswahl einiger zentraler Variablen
Designs
Arten
Retrospektive Studie: simulierter Längsschnitt -> Vpn werden zu ihrer Vergangenheit befragt
Panel-Studie/ Prospektive Studie: eine Stichprobe wird zu mehreren Messzeitpunkten untersucht
cross-lagged-Panel: min. 2 Variablen werden beide zu min. 2 Zeitpunkten betrachtet -> kann mehr Zusammenhänge zwischen Variablen u. Messzeitpunkten herausfinden
Risiken bei der Längsschnittstudie
Testwiederholungseffekte (Übungseffekte)
Regression zur Mitte
Messung der Konstrukte (Anpassung der Messinstrumente)
Reifung der Teilnehmer
Sterblichkeit/ systematische Abbrüche
Externes Geschehen
-> interne Valididität gefährdet
Was ist die Operationalisierung?
“Übersetzung eines wissenschaftlichen Begriffs bzw. eines theoretischen Konstrukst in eine messbare Größe (-> Messbarmachung)
unbeobachtbare theoretische Begriffe einer psychologischen Hypothese werden übersetzt in beobachtbare Variablen einer empirischen Hypothese
Was muss operationalisiert werden?
alle Variablen (jede AV u. jede UV)
Klassifikation von Variablen
Beobachtbarkeit
latent: nicht direkt beobachtbar -> Messung erfolgt indirekt durch korrespondierende manifeste Variablen
manifest: direkt beobachtbare Ausprägungen
Zählbarkeit der Ausprägungen
diskret (diskontinuierlich): abzählbar
stetig (kontinuierlich): überabzählbare mögliche Ausprägungen in einem Intervall
Skalenniveau
Nominalskala
Ordinalskala
Intervallskala
Verhältnisskala
Absolutskala
Klassifikationen u. Kategorien -> Daten können in keine logische Rangordnung gebracht werden (gibt kein besser/ schlechter)
Variablen sind: -> kategoriale Variablen
diskret: keine Zwischenstufen o. Übergänge zwischen den Kategorien
qualitativ: Zugehörigkeit zu einer Kategorie (bringen Qualität u. nicht ein Ausmaß zum Ausdruck
in Kategorien einteilbar
Bsp.: Geschlecht, Haarfarbe, Automarke
die Kategorien sind durch Rangordnung definiert
aber die Abstände zwischen den Ausprägungen sind nicht interpretierbar, da sie nicht exakt gleich sind -> nur größer/ kleiner Aussagen
Variablen sind (-> kategoriale Variablen): diskret, qualitativ, in Kategorien einteilbar UND in Rangordnung zu bringen
Bsp.: Schulnoten (da die zu erreichenden Punkte unterschiedliche Abstände haben), Bildungsstand, militärische Ränge, Wettkämpfe
Intervallskala -> ab hier metrische Skala (Kardinalskala)
Kategorien, Rangordnung u. Abstände sind definiert (kein natürlicher Nullpunkt)
Variablen sind -> metrische Variablen
stetig: unendliche viele Zwischenstufen
quantitativ: gibt Aussage über das Ausmaß bzw die Ausprägung
in Kategorien eingeteilt, in Rangordnung u. Abstände immer gleich!!!
Bsp.: Temperatur in °C, IQ, alle psychologischen Konstrukte (Geduld, Fremdenfeindlichkeit, Empathie, Durchhaltevermögen,…)
Verhätnisskala
Rangordnung, Abstände u. natürlicher Nullpunkt sind definiert
Variablen sind: stetig, quantitativ, ….
Bsp.: Reaktionsgeschwindigkeit, Gehalt, Gewicht, Alter, Körpergröße, Kelvin-Temperaturskala
Rangordnung, Abstände, natürlicher Nullpunkt u. natürliche Einheit sind definiert
Variablen sind:
stetig (manche Lehrbücher sagen sie ist diskret)
quantitativ
in gleiche Abstände zu bringen
in den Merkmalsausprägungen gibt es natürlichen Nullpunkt
natürliche Einheit (kann eine Anzahl angeben)
Bsp: Anzahl an Fachsemestern, Verhaltensbeobachtung (Anzahl an Verlegenheitsgesten)
Gütekriterien der Variablen
Objektivität
Reliabilität
Validität
Grad der Unabhängigkeit des Testergebnisses von…
der Person, die Test mit Vpn durchführt (Durchführungsobjektivität)
der Person, die den Test auswertet (Auswertungsobejktivität)
der Person, die den Test interpretiert (Interpretationsobjektivität)
Genauigkeit mit der das Merkmal gemessen wird
je kleiner der Messfehler, desto reliabler
Störeinflüsse: situative Störungen, Müdigkeit der Vpn, Missverständnisse
Grad für die Güte eines Tests/ Messung
Grad der Übereinstimmung des gemessenen Merkmals mit dem intendierten Merkmal
“misst der Test was er soll?”
Formen
interne Validität: sind die Ergebnisse kausal interpretierbar
Augenscheinvalidität: auch für Laien ist erkennbar, welche Merkmale durch den Test erfasst werden sollen
externe Validität: sind die Ergebnisse generalisierbar
Konstruktvalidität: aus Definition eines Konstrukt wird abgeleitet, mit welchen anderen Maßen der Test hohe, geringe, keine Korrelation
Kriteriumsvalidität: Festlegung mit welchen manifesten Merkmaken der Test korrelieren soll
statistische Validität: sind die statistischen Verfahren korrekt angewendet worden
Welche Datenquellen gibt es?
Befragung
Beobachtung
Test
Apparative Techniken
wie aufgebaut?
Art des Kontaktes: persönlich, telefonisch, schriftlich
Grad der Strukturierung: strukturiert: wenig, teil, stark
Anazhl der Befragten: Einzel- vs Gruppenbefragung
Items
Formulierung beachten
gerade genug Items um Variable abzubilden
Inhalts- vs Funktionsitems (Distraktor-, Eisbrecher-, Filteritems)
offen, geschlosse, quasi-geschlossen
Skala
Numeral-, Verbal-, Symbol-, graphische Skala
uni- vs bipolar gepolt
gibt es neutrale Mitte?
Selbst- vs Fremdbeobachtung
offen vs verdeckt
teilnehmend vs nicht-teilnehmend
direkt vs indirekt (non-reaktiv)
Tests
Persönlichkeitstests:
keine objektive Beurteilung der Antworten möglich
subjektive: Selbstauskunft
objektiv: Messintention ist verborgen
Leistungstests:
eindeutig richtig u. falsche Antworten
z.B. Intelligenztest
Apparative Messungen
Reaktionszeit-Messungen
Physiologische Messungen
Wie sollten Inhaltsitems formuliert sein?
klar u. deutlich
kurz u. prägnant -> keine langen Sätze (Überforderug)
einfache Sprache
keine doppelten Verneinungen
die Frage soll keine Antwort suggerieren
pro Item nur eine Information abfragen
wenn Zeitangaben nötig sind: konkrete Zeitangaben o. klar definierte Zeitangaben beinhalten
Population
Grundgesamtheit
Gesamtheit aller Fälle, über die in einer Studie wissenschaftlich etwas ausgesagt werden soll
Stichproben
Teil der Grundgesamtheit (der nach einem bestimmten Auswahlverfahren zustande gekommen ist= Stichprobenziehung)
Zufallsstichproben
einfache Zufallsauswahl
systematische Zufallsauswahl
geschichtete Zufallsstichprobe
Klumpenstichprobe
mehrstufige Zufallsstichprobe
Stichproben ohne Zufallsauswahl
Gelegenheitsstichprobe
Quotenstichprobe
Schneeballstichprobe
theoretische Stichprobe
Planung der Durchführung
Wer wird zur Teilnahme eingeladen?
Definition Grundgesamtheit
Festlegung der Stichprobenart
Stichprobenumfangsplanung
Wie werden die Vpn eingeladen?
Aushang/ Flyer
SONA
Was wird benötigt?
Experimentalprogramme
Apparate (PCs, Eyetracker..)
Süßigkeiten, Geld
Ordner mit allen Dokumenten: Einverständniserklörung, Debriefing, Quittungsliste, Fragebögen, Ablaufplan mit Regeln für das Verhalten der Vl
Wann wird erhoben?
Semsterferien vs Vorlesungszeit
Wo wird erhoben?
Online vs Labor
Planung der Auswertung
Auswertungsverfahren festlegen
ergibt sich aus Untersuchungsdesign, Skalenniveau der Variablen u. der Voraussetzung der Tests
Auswahl einer Software
SPSS, R, …
Erstellung eines Beispieldatensatzes
selber mehrmals mit verschiedenen Angaben teilnehmen o. Pilotstudie
Skript zum Datenmanagement u. Datenaufbereitung vorbereiten
Analyseverfahren anwenden
Überprüfung, ob man alle Variablen erhebt, die wichtig sind
Fragestellung wirklich mit den erhobenen Variablen untersuchbar?
Interpretation möglicher Ergebnisse
gibt es konfundierende Variablen?
sollten weitere Variablen als Kontrollvariablen erhoben werden?
Was gehört in ein Exposé?
Titel, 1. u. 2. Prüfer
Kontaktangaben der Studierenden
Ziele u. Fragestellung sowie kurze Herleitung
Überlegungen zum methodischen Vorgehen bei der Bearbeitung der Fragestellung
konkrete Planung der Erhebung von Daten
bei empirischen Arbeiten: Versuchspersonen, Design, Vorgehen, Instrumente…
Arbeitsplanung mit Zeitplan
alle Größen die die AV beeinflussen, aber in der geplanten Studie nicht von Interesse sind
Einfluss
mit UV konfundiert -> systematischer Fehler
nicht mit UV konfundiert -> zufälliger Fehler
Art
personenbezogene
Unterschiede bzgl. stabiler Merkmale der Vpn
untersuchungsbezogene
Unterschiede bzgl. Ort/ Zeit/ Versuchsleiter
motivated reasoning
Reaktivität
Kontrolle von Störvariablen
beide
Konstanthaltung:
U: konstante Rahmenbedingungen, Abfolge, standardisierte Instruktionen
P: möglichst gleiche Ausprägung in allen Gruppen
systematische Variation: Verwendung einer weiteren UV -> Analyse HE u. IE
Registrierung: potentielle Störvariablen miterheben
Personenbezogene
Randomisierung: zufällige Zuteilung der Vpn zu den Versuchsbedingungen der UV
Parallelisierung/ Matching:
P: potentielle Störvariable soll in allen Gruppen ähnlichen Mittelwert, Varianz haben
M: Bildung von Vpn Paaren mit ähnlicher Ausprägung im Merkmal, die dann randomisiert in die Gruppen eingeteilt werden
Elimination: Einflüsse potentieller Störv. werden ausgeschlossen
Einfachblind: Vp kennt Hypothese nicht
Doppelblind: Vp u. Vl kennen Hypothese nicht u. nicht in welcher Bedingung Vp ist
Forschungsethik vs Wissenschaftsethik
Forschungsethik: Schutz von Würde u. Wohlergehen der Vpn
durch ethischen Umgang mit Versuchspersonen
Freiweilligkeit u. informierte Einwilligung (Inventivierung, informed consent, Täuschung u. Debriefing)
Schutz vor Beeinträchtigung u. Schädigung
Anonymisierung u. Vertraulichkeit der Daten
allgemeine Richtlinien in der Psychologie (APA, DGP, BDP)
Wissenschaftsethik: Orientierung von wissenschaftlichem Erkenntnisgewinn an den Regeln guter wissenschaftlicher Praxis
Was ist Open Science?
offene/ transparente Wissenschaft, Prinzipien u. Methoden
die der Transparenz u. Replizierbarkeit publizierter psychologischer Befunde u. somit der Qualitätssicherung psychologischer Forschung dienen
durch die Replikationskrise hat sie an Bedeutung gewonnen
Replikationskrise
methodische Krise (über mehrere Fachbereiche)
eine Vielzahl an Studien kann nicht durch Replikation bestätigt werden
Maße für Verlässlichkeit von Befunden
Reproduzierbarkeit: Verwendung der gleichen Daten u. der gleichen Analysestrategie
Robustheit: Verwendung der gleichen Daten aber andere Analysestrategie
Repliziebarkeit: Befund wird mit unterschiedlichen Daten (als die Originaldaten) geprüft
Was beinhaltet alles die Open Science?
Open Data: freier Zugang zu wissenschaftlichen Daten
Open Access: freier Zugriff zu Fachartikeln in Zeitschriften
Open Methodology: Zugriff auf Forschungsmethoden u. Material + a priori Hypothesen u. ursprünglich geplante Analyseverfahren
Open Source: freier Zugang zu Software u. Computer coded
Open Peer Review: frei zugängliche Reviews einsehen können
Qualitative Forschung
Kategorien entwickeln
deduktiv
Kategorien im Vorhinein festgelegt
basierend auf Vorwissen
Textinhalte werden daraufhin zugeordnet
induktiv
beim Lesen/ Hören des Textes werden die Kategorien entwickelt
Schlüsselfrage: durch welche Kategorie wird diese Textstelle sinnvoll abgebildet?
deduktiv-indukitv
einige Kategorien werden im Vorhinein auf Basis von Vorwissen abgeleitet
andere werden bei der Betrachtung des Materials entwickelt
Bestätigungsfehler
Neigung von Menschen, Informationen so auszuwählen, zu suchen u. zu interpretieren, dass diese die eigenen Erwartungen bestätigen
Pretest
Messung der AV vor der Manipulation
evtl. sind KG u. EG nicht vergleichbar -> unterschiedliche Ausgangsbedingungen
-> kann zu einer falschen Interpretation der Ergebnisse führen
Solomon 4- Gruppen Plan
Überprüfung möglicher Wirkungen von Pretest-Effekten
4 Gruppen:
2 mit Pretest (jeweils Beidngung 1 u. 2)
2 ohne Pretest (jeweils Bedingung 1 u. 2)
alle Posttest
die AV unterscheidet sich zwischen den Stufen eines Faktors
Anzahl Faktoren= Anzahl HE
der Effekt von Faktor A auf die AV unterscheidet sich zwischen den Stufen von Faktor B
disordinal, ordinal, semi-disordinal
n! / k! x (n-k)! = (n über k)
Bestimmung der Reliabilität
Retest-Reliabilität (Stabilität):
Test-Retest-Korrelation (Test wird 2x durchgeführt) -> je höher, desto reliabler
Stabilität= Test-Retest-Korrelation über längere Zeitspanne
je länger die Zeitspanne, desto geringer die Retest-Reliabilität
nur bei “stabilen” Konstrukten (nicht bei veränderlichen Merkmalen)
Paralleltest-Reliabilität (Äquivalenz):
zwei Versionen eines Messinstruments werden getestet, die dasselbe Merkmal messen (gleiche Vpn durchlaufen erst die eine dann die andere Version)
Anwendung wenn erneute Testung durch Testwiederholungseffekte verzerrt werden würde
Korrelation von zwei Testversionen
interne Konsistenz
Grundannahme: jedes Item soll das (gleiche) Konstrukt abbilden
durch viele ähnliche Items werden die Messfehler, der einzelnen Items gemittelt
je mehr Items ein Fragebogen -> desto reliabler
Messungen: Testhalbierungs-Reliabilität u. Cronbachs Alpha
Wertebereich: 0 bis 1
>0,7: akzeptable Reliabilität
>0,8: gute Reliabilität
>0,9: sehr gute Reliabilität
einfache Zufallsstichprobe
jedes Mitglied der Population hat gleiche WK in die Stichprobe aufgenommen zu werden
Voraussetzung: Population ist bekannt
sytematische Zufallstichprobe
z.b. jedes 5. Element der Population wird ausgewählt
Vorteil: einfach zu realisieren u, bei infiniten Populationen anwendbar
Nachteil: nicht völlig zuföllig, problematisch wenn Elemente in der Populationsliste nach Kriterium geordnet
geschichtete Zufallstichprobe
Bildung der Schichten nach mehreren Dimensionen
Merkmalsausprägungen definieren Schichten (Strata) der Population
für jede Schicht wird eigene Stichprobe erhoben
proportional: die relative Größe der Schichten in der Stichprobe entspricht den relativen Größen der Schichten in der Population -> nur proportionale sind repräsentativ (relativen Größen in der Strata müssen bekannt sein)
disproportional: keine Äquivalenz der Häufigkeiten -> genauere Beschreibung von Minderheiten, imdem sie überrepräsentiert werden
insbesondere wenn Merkmale mit dem zu untersuchenden Merkmal hoch korrelieren, wird dadruch eine exakte Schätzung möglich
Repräsentativität bestimmter Merkmale ist gewährleistet
Repräsentativität
Stichprobe ist repräsentativ wenn sie die gleiche Zusammensetzung wie die Population hat
Welche Zufallstichproben garantieren repräsentativität?
einfache u, systemische nicht
mit geschichteten Zufallsstichproben wird die Repräsentativität für bestimmte Merkmale gewährleistet
Gesamtheit besteht aus vielen natürlichen Teilpopulationen
-> zufällige Auswahl von Klumpen wird vollständig erhoben
Bsp: Schulklassen
Vorteil: es wird kein Gesamtregister für alle Populationsmitglieder gebraucht
bessere Schätzung der Populationsparameter wenn
mehr Klumpen gezogen werden
die Klumpen untereinander ähnlich sind
die Klumpen in sich heterogen sind
auf verschiedenen Ebenen werden hierarchisch untergeordnete Teilstichproben ausgewählt
Bsp.: 3-Stufige Stichprobe
Zufallsauwahl Uni
Zufallsauswahl Studiengang
Zufallsauswahl Studierende
Probanden werden ausschließlich nach Verfügbarkeit ausgwählt
in einer Gelegenheitsstichprobe sollen bestimmte Quoten erfüllt werden
die Quotenstichprobe muss sich nicht an den Populationsanteilen orientieren
Bsp: 5% Arbeitslose
Mitglieder einer Population werden gebeten, über soziale Netzwerke weitere Vpn zu rekrutieren
bei schwer erreichbaren Populationen
wenn Mitglieder der Population gut vernetzt
Vpn werden theoriegeleitet nach dem Ziel der Studie ausgewählt
(eher in der qualitativen Forschung)
Abbruchkriterium: “theoretische Sättigung”
Vor- und Nachteile willkürliche Stichproben
Vorteil
praktikabel
kostengünstig
eingeschränkte Repräsentativität
verzerrte Populationsparameter (Mittelwert, Varianz)
Wann sind willkürliche Stichproben akzeptabel und wann sind sie probelmatisch?
problematisch, wenn
konkrete Merkmalsausprägungen bestimmt werden sollen (z.B. Parteipräferenzen für Wahlprognose)
Einfluss der Bevölkerungsschicht auf Zusammenhänge
akzeptabel, wenn
die absoluten Merkmalsausprägungen unwichtig sind
es unplausibel ist, dass sich Zusammenhänge zwischen den Bevölkerungsschichten grundsätzlich unterscheiden
Kontrolle von Störvariablen bei der Auswertung
Ausschluss von Vpn, bei denen Besonderheiten auftraten
separate Analysen für verschiedene Gruppen
potentielle Störvariable wird als weiterer Faktor in die Analyse aufgenommen
-> mögliche kein HE aber IE
Aufnahme als Kovariante (Kontrollvariable) -> Herausrechnen der Variable
Versuchsleitung macht systematische Fehler bei der Datenaufzeichnung, die die Hypothese stützen
Vpn ändern ihr Verhalten, weil sie untersicht werden (unabhängig vom eigentlichen Treatment)
Hawthorne-Effekt
Placebo-Effekt
Bewertungsangst
Vermutungen über die Hypothese
Demand-Effekte
reaktantes Verhalten
Rosenthal-Effekt
“der kluge Hans”
soziale Erwünschtheit
Vpn ändern ihr Verhalten, weil sie wissen, dass sie an einer Studie teilnehmen u, unter Beobachtung stehen
Wirkung eines Medikaments/ Treatments, weil die Betroffenen glauben, dass das Medikament/ Treatment wirkt
zwei (potentielle) Wirkungen
medizinisch: der Wirkstoff
psychologisch: Glaube an die Wirksamkeit
führt zu schlechterer Leistung
v.a. bei Psychologiestudenten
Vpn wollen hilfreich u. nett sein v.a. wenn sie Vl persönlich kennen
hypothesenkonträres Verhalten
Tendenz, Selbstauskunftsfargen (in Interviews, Fragebögen, Persönlichkeitstest) entsprechend der sozialen Norm u. Erwartungen zu beantworten
stattt dem realen Erleben u. Verhalten
der kluge Hans
Versuchsleiter-Erwartungseffekt
unbewusste Beeinflussung des Verhaltens von Vpn/ Versuchstieren durch die eigene Erwarungshaltung, die das Experiment in die erhoffte Richtung lenken
Versuchsleiter-Erwarungseffekt
die Erwarungen der Versuchsleitung beeinflussen das Verhalten der Vpn
ethisch fragwürdige Untersuchungen
Stanford Prison Experiment
UV: Rolle (Häftliche u. Wärter)
AV: Verhalten in Gefägnissituation
Ergebnisse:
Anonymität u. Deindividuation
Macht der Regeln u. Vorschriften
Rollenidentifikation u. Verantwortung für Übertretung
kognitive Dissonanz
Bedürfnis sozialer Anerkennung
Monster Studie
ab wann sind Prinzipien der Forschungsethik verletzt?
Freiwilligkeit u. informierte Teilnahme
Incentivierung
informed consent
Täuschung u. Debriefing
Inhalt informed consent
wahrheitsgemäße Angabe zu Zweck, Dauer u. Vorgehen der Studie
Informationen über Bonus für Teilnahme
Informationen, dass die Teilnahme zu jedem Zeitpunkt abgebrochen werden kann
Konsequenz der Nicht-Teilnahme o. vorzeitigen Beendigung
Möglichkeit der Datenlöschung am Ende der Studie
Gewährleistung von Vertraulichkeit u. Anonymität
Kontaktadressen bei Fragen
möglicher Nutzen
mögliche Beeinträchtigungen
Zuletzt geändertvor 2 Jahren