Datenerhebung
Datenerhebung („data collection“) ist essenzieller Bestandteil jeder empirischen Studie
Eine mehr oder minder ausgedehnte Zeitperiode, in der systematisch nummerisches und/oder nicht-nummerisches Datenmaterial gesammelt wird
Was ist der Unterschied zwischen quantitativen und qualitativen Datenerhebungsmethoden?
Quantitative Methoden sind unter anderem Messungen, Zählen, die Analyse statistischer Daten, Befragungen, Tests sowie strukturierte Beobachtungen. Bei der qualitativen Datenerhebung werden detaillierte, subjektive und individuelle Erkenntnisse über Einstellungen und Handlungen ermittelt.
Erhebungsverfahren (quantitative Methoden)
Beobachtung und Codierung
Selbstberichtsverfahren: Befragung und Rating
Semantisches Differenzial
Nichtreaktive Erhebungsmethoden
Der psychologische Test
(Leistungs- und Persönlichkeitstests)
Randomized-Response-Technik
Datenerhebung im Internet
Biopsychologische und neurowissenschaftliche Messungen
Was ist das Black-Box-Problem?
Mentale Prozesse nicht direkt beobachtbar. Gedächtnis, Lernmechanismen, Motivation, etc. als Erklärungsmechanismen für Informationsverarbeitung und Verhalten.
Was ist ein zentrales Ziel der Psychologie?
Ein zentrales Ziel psychologischer Forschung ist die Erhellung der „Black Box “ (des nicht direktbeobachtbaren psychischen Innenlebens)
Wann können Selbstauskünfte reliable und valide Datenquellen sein?
die untersuchten Personen Zugang zu den relevanten psychischen Prozessen haben und über
diese Prozesse ohne Verzerrung selbst Auskunft geben können (und wollen).
die Prozesse per se nicht unbedingt von Interesse sind, sondern nur die dem Bewusstsein zugänglichen Ergebnisse (z.B. Messung von Unterschieds- oder Absolutschwellen in Wahrnehmungsexperimenten)
Wie wird Selbstebobachtung (Introspektion) in der Psychologie verwendet?
Selbstbeobachtung (Introspektion) in den Anfängen der Psychologie im 19. Jh. vielfach verwendet, insbesondere in Wahrnehmungsexperimenten
vom Behaviorismus aber als unwissenschaftlich abgelehnt.
Was ist die Reaktivität?
Veränderung bzw. Verzerrung der erhobenen Daten alleine aufgrund der Kenntnis der untersuchten Personen darüber, dass sie Gegenstand einer Untersuchung sind
Hawthorne-Effekt
In Untersuchungen über industrielles Arbeitsverhalten variierten sie verschiedene Arbeitsbedingungen.
Was immer sie taten, die Arbeitsleistungen der Mitarbeiterinnen stiegen.
Arbeitsstunden, Pausen, Beleuchtung, Bezahlung etc. wurden verändert, zum Teil objektiv verschlechtert.
"Hawthorne-Effekt" wird durch die Aufmerksamkeit erklärt, die den Arbeiterinnen durch die Forscher entgegengebracht wurde.
Wissen, dass man beobachtet wird oder Teil einer wissenschaftlichen Studie ist, kann Verhalten und Erleben verändern – unabhängig von der Variation der eigentlichen Variablen von Interesse.
Maßnahmen zur Verringerung des Reaktivitätsproblems
Untersucht in Unkenntnis lassen, dass sie untersucht werden
->Nur in Feld-, Archiv- und Internetstudien praktikabel
Untersuchten Anonymität zusichern
-> Besonders wichtig bei der Erhebung von persönlichen Meinungen, Einstellungen oder anderen sensiblen Daten
Untersuchten eine Coverstory über den Untersuchungszweck mitteilen
-> Wichtig in hypothesenprüfenden Studien, in denen die Untersuchten die erforschten Verhaltensweisen kontrollieren oder gezielt steuern können; dies ist aber jeweils ethisch zu reflektieren
Maße einsetzen, die die Untersuchten nicht kontrollieren oder beeinflussen können ( nichtreaktive Messverfahren )
-> Wird angenommen für biopsychologische Maße, die willkürlich nicht oder kaum steuerbare physiologische Vorgänge erfassen, wie etwa die Messung des Kortisolspiegels oder bildgebende Verfahren zur Registrierung der Gehirnaktivität
indirekte/ implizite Messverfahren einsetzen
-> Neuerer Ansatz, bei dem die Untersuchten aus der Art der gemessenen Verhaltensweisen (oft Reaktionszeiten) nicht oder nur schwer auf das untersuchte psychologische Konstrukt (z.B. Vorteile gegenüber Fremdgruppen) schließen können; die Verfahren(z.B der IAT) werden noch kritisch diskutiert, sind aber eine interessante Option
Was ist der implizierte Assoziationstest?
Messverfahren aus der Sozialpsychologie (Greenwald et al., 1998) um Einstellungen zu erfragen, die Leute nicht angeben wollen oder können
Einsatz vor allem zur Messung von Einstellungen gegenüber Objekten des Selbstwerts, der Identität und Stereotypen
Idee: Personen fällt es leichter, auf assoziierte Konzepte mit derselben Antworttaste als mitder entgegengesetzten Antworttaste zu reagieren (Drücken Sie „links“ wenn der Begriff Male oder Career ist, sonst „rechts“), da verwandte kognitive Konzepte mitaktiviert werden
Beobachtung
Wissenschaftliche Beobachtung ist die systematische und regelgeleitete Registrierung des Auftretens bzw. der Ausprägung von ausgewählten, psychologisch relevanten Merkmalenoder Ereignissen. Kann im Labor oder in „natürlichen“ Umgebungen stattfinden.
Wichtige Faktoren für einen Beobachtungsplan
was beobachtet werden soll;
welche Aspekte weniger oder nicht relevant sind;
welchen Interpretationsspielraum der Beobachtende bei der Beobachtung hat;
wann, wie lange und wo die Beobachtung erfolgt;
auf welche Weise das Beobachtete registriert und protokolliert wird.
Welche Herausforderungen gibt es bei der Beobachtung?
typischen Herausforderungen der (visuellen) Wahrnehmung konfrontiert
->Selektion von Informationen aus komplexem Strom der visuellen Wahrnehmung
Wahrnehmungspsychologie
Wahrnehmungsprozesse sind konstruktiv, Beobachter erzeugen ein Bild der Wirklichkeit, das von Einstellungen, Erwartungen und Vorerfahrungen abhängt; ferner: Urteilsfehler, Erinnerungsfehler, Wiedergabefehler (Arbeitsparen)
Beobachterabhängige Selektivität und Konstruktivität muss möglichst kontrolliert werden
Lösungsansätze
Möglichst hohe Standardisierung der Protokollierung
Videoaufzeichnung
Mehrere Protokollanten und Berechnung des Grades der Übereinstimmung (Interrater Reliabilität; Konkordanz)
Zeitstichprobe
Bei der Zeitstichprobe werden Beobachtungen in festen Intervallen aufgezeichnet. z.B. alle 20 Sekunden aufzeichnen, was eine Person grade tut
Ereignisstichprobe
Bei der Ereignisstichprobe hingegen wird das Auftreten, die Auftretensdauer (oder Auftretenshäufigkeit) von definierten Ereignissen aufgezeichnet.
Wie lange und/oder wie oft treten Ereignisse auf? (z.B. Verbal Interaction Category System)
Besser als Zeitstichprobe für Erfassung seltener Ereignisse
Ermöglicht auch Erfassung von systematischen Abfolgen (Kontingenzen) zwischen Handlungen
Active Appearance Model
Wenn Menschen sich unterhalten, passen sie ihre Bewegungen, ihre Mimik und ihre Stimmlage aneinander an.
Zur Untersuchung werden hier teils Gesichter auf statistische Modelle zurückgeführt, die man dann experimentell manipulieren kann (Active Appearance Model)
Experimentell zeigte sich, dass (naive) VP intensivere Bewegungen ausführen, wenn das manipulierte Gegenüber weniger expressiv ist
Formen der Datenergebung
Befragung
Allgemeine Grundform der Datenerhebung
Rating
Spezielle Variante der Befragung mit Urteilen auf einer numerisch interpretierbaren Skala
Was ist ein Item?
Ein Item ist eine als Frage oder als Urteil formulierte Aussage, zu der die befragte Person ihre Zustimmung oder Ablehnung – ggf. in unterschiedlicher Intensität – äußern kann.
Was sind die 3 Prozesse zur Selbstauskunft
Der erste Prozess beinhaltet die Interpretation der Frage, d.h. die Beurteilung dessen, was Forscherende oder Interviewer:in mit der Frage meint.
Der zweite Prozess umfasst den Abruf und die Konstruktion eines eigenen Urteils, das die Beantwortung der Frage erlaubt.
Der dritte Prozess beinhaltet die Übersetzung des Urteils in eine kommunizierte Auskunft.
Was sollte immer beachtet werden bei Befragungen und Ratings?
Interpretieren die Befragten die Frage oder Themenstellung so, wie die ForscherInnen es intendieren?
Wie kann man möglichst gut sicherstellen, dass diejenigen Aspekte oder Themen berücksichtigt werden, die die Forschenden im Blick haben?
Werden durch die Art der Befragung oder Formulierung Informationen nahegelegt, die die Befragten zur Beantwortung der Frage heranziehen?
Können die Antworten / Urteile gut auf die verwendete Skala abgebildet werden? (Differenzierung der Skala; Bodeneffekte; Deckeneffekte)
Was sind die Unterschiede zwischen mündlicher und schriftlicher Befragung?
Schriftliche Befragung
Mündliche Befragung
Typischer in der quantitativen Forschung
Typischer in der qualitativen Forschung
Höherer Grad an Standardisierung
Oft kein typischer, vorgegebener Ablauf vorhanden
Meist geschlossene Fragen mit vorgegebenen Antworten
Häufig aufwändiger und kostenintensiver
Vorwissen zur Formulierung der Fragen nötig
Befragte sind oft häufiger bereit sich zu äußern
Weniger mit dem Problem der Reaktivität behaftet
Stärker mit dem Problem der Reaktivität behaftet
Generelle Prinipien für die Fragebogenkonzeption
Einfache Formulierung und gute Verständlichkeit (siehe bspw. www.leichte- sprache.org)
Keine zu hohen Anforderungen an die mentale oder kognitive Leistungsfähigkeit der Befragten (z.B.: Wie viele Minuten haben Sie vergangenen Mittwoch vormittags im Nahverkehr zugebracht?), es sei denn dies ist ein verstecktes Selektionskriterium
Keine (doppelte) Verneinungen in den Fragen
Keine überfrachteten Fragen (z.B. Wie sehr mögen Sie Semesterferien und Ferienjobs? Befürworten Sie das generelle Verbot von Ladenöffnungszeiten an Feiertagen, um die Interessen der Angestellten zu schützen?); besser: Einsatz mehrerer Items zur Beantwortung einer Frage (Subskalen)
Adressatenorientierte Formulierung: Zielgruppe festlegen und Fragen an das Verständnisniveau der Probanden anpassen (Sprachniveau, Bildungsniveau)
Schlechtes Beispiel: „Bei welchem Provider haben Sie einen Postpaid-Vertrag?“
Besser: „Bei welchem Mobilfunkanbieter haben sie einen Vertrag mit monatlicher Abrechnung?“
Empfehlung: leicht verständliche und grammatikalisch richtige Items zu verwenden. Diese sollten in Alltags- und nicht in Wissenschaftssprache sowie sachlich und neutral formuliert werden. Nur so kann man sicher stellen, dass alle Befragten die Fragen in gleicher Weise verstehen und in der Lage sind, sie richtig zu beantworten
Hilfreich kann es daher sein, zu überprüfen, ob es für die zentralen Begriffe in den einzelnen Fragen Synonyme gibt, die geläufiger sind. Ist dies der Fall, so sollte man die wenigergeläufigen Begriffe durch diese Synonyme ersetzen (z. B. statt „Diskrepanz“ besser„Unterschied“).
Wie sollten Fragen formuliert sein?
Keine „Forced Choice“ bei unabhängig beantwortbaren Aspekten (z.B. mögen Sie lieber Forschungsmethoden oder biologische Psychologie?)
Keine Fragen, die die Befragten sehr ähnlich beantworten (geringer Informationsgehalt! Ermüdung/Motivationsverlust)
Beachtung der Ausgewogenheit in der Reihenfolge der Fragen („Warm-Up-Phase mit einfachen Fragen; persönliche Fragen eher später)
Klare und informative Instruktion.
Allgemein gilt unbedingt:
Vor der eigentlichen Durchführung immer Pilotstudien machen, d.h. Fragebögen und Instruktionen mit ein paar Probanden testen und diese um qualitatives Feedback bitten – iterativ so lange, bis allen alles klar ist!
Was sind Wesentliche Aspekte bei der Konstruktion von Ratingskalen?
Items können die Form einer Frage oder Aussage haben
Eine Skala kann unipolar oder bipolar formuliert sein
Die Anzahl der Stufen „muss zum Gegenstand passen“; häufig werden 4 bis 9 Stufen verwendet. Zu wenige Stufen: tendenziell zu „grob“; zu viele Stufen: kann man u.U.nicht mehr sinnvoll differenzieren.
Ungerade Anzahl von Stufen suggeriert einen neutralen Mittelpunkt, der entweder eine gleichgültige oder zwiespältige Einstellung bedeutet – muss je nach Kontext entschieden werden, ob man das will oder nicht bzw. interpretiert.
Boden- und Deckeneffekte müssen vermieden werden (bspw. durch Pilotierung) – diese treten auf, wenn die Ratingskala an den Enden nicht ausreicht, bzw. genau genug aufgelöst ist
Polarität von Ratingskalen
bipolar, wenn es einen Gegensatz gibt: zufrieden/unzufrieden, glücklich/unglücklich, wichtig/unwichtig
unipolar, bspw. wenn es um Ausprägung oder An/Abwesenheit einer Sache geht: Häufigkeiten
Eine Rating-Skala ist bipolar, wenn zwei gegenteilige Dimensionen abgebildet werden (positiv – negativ; lehne ab / stimme zu)
Sie ist unipolar, wenn ein Kontinuum von Ausprägungen abgebildet wird (nicht zufrieden bis zufrieden)
forced choice
Oft will man Ratings erzwingen (forced choice), um möglichst aussagekräftige Datensätze zu erhalten
Forced Choice kann aber auch problematisch sein, wenn nicht alle Antwortmöglichkeiten abgedeckt sind
Beispiel: Erzwungene Produktbewertung am Tag des Erhalts des Produkts
Varianten von Ratingskalen
nummerisch
verbal
grafisch
unipolar
bipolar
Ankerbeispiele beinhalten
Wo werden Fragebögen zentral eingesetzt?
Persönlichkeitspsychologie
Spezielle Form von Ratingverfahren – liefert Polaritätsprofile, die eine schnelle Orientierung über zentrale Merkmale bzw. Unterschiede zwischen Merkmalsträgern erlauben.
Urteilstendenzen bei der Beantwortung von Ratingskalen
Tendenz zur Mitte (Vermeiden von Extremurteilen, bzw. unklare Pole der Skala)
Gedankenlose Reproduktion (als Folge ähnlicher Items; evtl. Pole vertauschen)
Primacy-Effekt (wenn anfängliche Urteile folgende, ähnliche Urteile gleichsinnig beeinflussen und folgende unähnliche Urteile gegensinnig; evtl. Randomisierung)
Halo-Effekt (wenn die Beurteilung eines Objekts hinsichtlich verschiedener Merkmale durch das Urteil auf einem zentralen Merkmal beeinflusst wird); insbesondere bei der Bewertung von Personen bspw. ähnliche ratings auf den Dimensionen: gutmütig, nett, freundlich
Halo-Effekt
Unter dem Halo-Effekt versteht man die Tendenz, bei Personen oder Dingen unbewusst von bekannten Eigenschaften auf unbekannte zu schließen. Diese kognitive Verzerrung wirkt oft langfristig, auch wenn sich der erste Eindruck im Nachhinein nicht als korrekt erweist.
Dieser Effekt spielt eine große Rolle in vielen Situationen des täglichen Lebens, wo erste Eindrücke wichtig sind; in der A&O-Psychologie: Personalauswahl oder im Marketing
Basiert auf Edward Thorndikes (1920) Studie „A Constant Error in Psychological Ratings”
Militärische Führungskräfte sollten dort ihre Soldaten bewerten
Die gefundenen Korrelationen waren zu hoch und zu gleichmäßig
Die durchschnittliche Korrelation der Ratings verschiedener Räter betrug für Körperbau mit Intelligenz 0,31, für Körperbau mit Führung 0,39 und für Körperbau mit Charakter 0,28
Verschiedene Studien zeigen, dass gerade subjektive Attraktivität einen Halo-Effekt erzeugt, bspw. erhalten attraktivere Kellner mehr Trinkgeld als unattraktive (Parrett, 2015)
Was sind indirekte Beobachtungen?
Archivdaten: Logbücher, Protokolle von Sitzungen
Verhaltensspuren: Abnutzung von Fussboden vor Kunstwerken in einem Museum, Analyse des Haushaltsmülls anstatt einer Befragung zum Verbrauch von Lebensmitteln
Prozessproduzierte Daten: Diese fallen als (Neben)produkt des Handelns öffentlicher Instanzen an; (amtliche) Statistiken z.B. zu Kriminalität, Wohnortswechsel, Steuer, Arbeitslosigkeit, Krankenkasse; aber auch Personaldaten von Firmen oder prozessgenerierte Daten beim Einkauf im Internet oder Nutzung sozialer Medien
Probleme: Geringe/keine Kontrolle über den Erhebungsprozess, Validität fragwürdig, üblich als Ergänzung zu einem Experiment/Studie
Last changeda year ago