Zustandsevaluation - Ziele
Ziele:
Ermitteln, ob es einen Interventionsbedarf gibt (PISA, IGLU & co) —> Bestandsaufnahme, Identifikation Problemfelder, Grundlage für Ableitung von Interventionsmöglichkeiten
Berichtspflicht —> Gesetzliche Vorgaben (Lehrevaluation, Studiengangsevaluation, Forschungsinstitute)
Ermitteln, ob eine Intervention weitergeführt werden muss —> Jährliche psychiatrische Überprüfung strafrechtlich angeordneter Unterbringung besonders gefährlicher aber schuldunfähiger Straftäter
Konfliktpotential bei Evaluation
explizite und implizite Ziele
implizite Ziele sollten zu Beginn der Evaluation offengelegt werden
schlichte Existenz ist unproblematisch
Aber eine Evaluation muss ergebnisoffen bleiben!! Sonst unwissenschaftlich
Datenerhebung bei Ist-Zuständen BEISPIEL Psychiatrie (Ergebnisse aus dem Plenum)
Abläufe erheben
Häufigkeit von Teammeetings erheben
Fragebogen zum Arbeiten in Teams austeilen
Größe der Gruppen erheben
Arbeitszufriedenheit erheben
Befragung von PAtient*innen
VOrkommen von Mobbing erheben
Multimethodale Diagnostik - Warum?
relevante Variablen ergeben sich aus Evaluationsfragestellungen
diese Variablen müssen angemessen operationalisiert werden
MULTIMETHODALE Vorgehensweise um Artefakte oder unpräzise Ergebnisse zu vermeiden
Fallzahlen bei Evaluationen können kleiner als in der Grundlagenforschung sein ABER meist mehr und vielfältigere Daten
Multimethodale Diagnostik
Nutzung von unterschiedlichen
Datenquellen (Perspektiven)
Erhebungsmethoden
Manifestationsebenen (Modalitäten)
Multiperspektivische Diagnostik - Warum
unterschiedliche Perspektiven (DAtenquellen)
Selbst- und Fremdeinschätzungen z.B.
Vorteile
vollständigeres Gesamtbild —> über Kontexte hinweg größere Generalisierbarkeit
Reliabilität —> jede Messung einzeln evtl. unsystematische Fehler
Akzeptanz einer Bewertung höher, wenn mehrere Quellen
Reaktive vs. nicht-reaktive Messungen
Reaktiv: untersuchte Personen sind sich der Datenerhebung bewusst (Fragebogenuntersuchung)
anfälliger für Verfälschungen und soziale Erwünschtheit
nicht-reaktiv: Messvorgang selbst beeinflusst das Verhalten nicht
weniger anfällig für Verfälschungen
meist mehrdeutig hinsichtlich dessen, was sie genau messen
Welche Erhebungsmethoden werden genutzt?
alle in der Psychologie üblichen ERhebungsmethoden
Fragebögen
Interviews
Tests
Dokumentenanalyse
standardisierte Beobachtungen
alles hat Vor- und Nachteile
durch sowieso anfallende Daten kann ergänzt werden
Was sind Beispiele für nicht-reaktive Messungen
Verhaltensspuren (Verbrauch bestimmter Materialien)
Dokumente z.B. Klassenbücher
Persönliche Profile in sozialen Netzwerken
Verschiedene Modalitäten der Erhebungen
viele Psychologisch relevante Merkmale werden durch verschiedene Indikatoren repräsentiert
Modalitäten sind: sinnvolle Kategorisierung der Indikatoren
z.B. Emotionale, Kognitive, Physiologische und Verhaltensmodalität
Gütekriterien
Güte von Erhebungsinstrumenten wird anhand von Gütekriterien beschrieben —> eine gute Operationalisierung ist eine notwendige Bedingung für gelungene Evaluation
aus Psychologischer DIagnostik:
Objektivität
Reliabilität
Validität
Ausmaß, in welchem die empirischen Befunde die beabsichtigte Evaluation unterstützen
kein Test in per se valide
Validität ist immer im Kontext der Verwendung zu betrachten
Reaktivität - Problem
erhobene Daten sind idR nur dann valide zu interpretieren, wenn Untersuchungsobjekte
sich typisch verhalten (so wie sie sich auch verhalten würden, wenn sie nicht beobachtet werden)
gestellte Fragen so interpretieren, wie es vorgesehen ist
Zugang zu den erfragten psychischen Inhalten haben
über psychische Inhalte unverzerrt Auskunft gegben
REAKTIVITÄT SCHRÄNKT ALL DAS EIN
Reaktivität Definition
Veränderung der erhobenen Daten schon aufgrund der Kenntnis der untersuchten Personen darüber, dass sie Gegenstand einer Untersuchung sind
Facetten Reaktivität
Aufforderungscharakter einer Befragungssituation
Selbstdarstellungstendenz (Soziale Erwünschtheit)
Hawthorne Effekt
Versuchsleiter-Erwartungs-Effekt (Rosenthal-Effekt / Pygmalion-Effekt)
Selbstdarstellungstendenz
relevant wenn Merkmale mit negativer normativer Valenz untersucht
Dummheit, aggressivität, cholerische oder rassistische tendenzen ungerne angegeben
es werden Annahmen über Gegenstand und Zweck der Untersuchung gebildet und dadurch wird ein spezielles Verhalten gezeigt
Verringern Effekte Selbstdarstellungstendenz
um ehrliche Antwort bitten
gibt kein richtig/falsch
Ergebnisse werden nicht zur Bewertung der Person verwendet
Soziale ERwünschtheit messen und statistisch kontrollieren
Erhebungsinstrument verhaltensnah gestalten
nicht-reaktive Messmethoden!
Produktivitätssteigerung bei
mehr / weniger Beleuchtungsstärke
verändertes Pausenregime
Verlängerung/Verkürzung Arbeitstage
—> Aufgrund von Reaktivität kann die Forschungsfrage nicht beantwortet werden
Verringern Hawthorne Effekt
Untersuchte in Unkenntnis, dass Untersuchung —> ethisch zu reflektieren
Coverstory über den Untersuchungszweck —> wichtig, wenn Untersuchte die erforschten Verhalten kontrollieren oder steuern können —> Ethisch zu reflektieren
Anonymität zusichern —> v.a. bei Meinungen, Einstellungen, sensiblen Daten
Maße einsetzen, die nicht kontrolliert oder beeinflusst werden können (nichtreaktiv) —> biopsychologische Maße, physiologische Vorgänge z.B. Kortisolspiegel oder bildgebende Verfahren
indirekte/implizite Messverfahren z.B. Reaktionszeiten
Rosenthal-Effekt
bewusstes und unbewusstes verzerren der Ergebnisse durch Versuchsleiter
Verringern Rosenthal-Effekt
schwer zu vermeiden, teilweise Überkompensation
Standardisierung des Versuchsablaufs
Doppel-Blind-Versuche
Versuchsleitung und Probanden wissen nichts über die Erwartungen der Studie und Versuchsbedingungen
Kennwerte bei Ist-Zuständen
deskriptivstatistische Kennwerte
Häufigkeit
Maße zentraler Tendenz
Streuungsmaße
Übliche inferenzstatistische Methoden
Inhaltliche Bedeutsamkeit von Kennwerten
nicht unbedingt inhaltlich bedeutsam, nur weil signifikant
hier standardisierte Effektstärken nützlich
Effektstärke -> Abweichung des Stichprobenmittelwerts vom Populationsmittelwert
Effektstärke —> Abweichung des Stichprobenmittelwerts von anderen unabhängigen Stichproben
ob Effektstärke bedeutsam ist, hängt vom Untersuchungsgegenstand ab
Verschiedene Vorgehensweisen Effektstärke zu berechnen
Standardabweichung von x in der Population
Standardabweichung von x von einer anderen Teilpopulation
Daumenregeln nach Cohen 1988
Bei Vergleich mit Population:
d= 0,14 klein
d= 0,35 mittel
d= 0,57 groß
Bei Vergleich mit unabhängiger Stichprobe:
d’= 0,2 klein
d’= 0,5 mittel
d’= 0,8 groß
Grundbegriffe der Epidemiologie
Prävalenz —> positiv diagnostizierte Individuen
zu einem Zeitpunkt (Punktprävalenz)
während bestimmter Zeitperiode (Periodenprävalenz)
Lebenszeitprävalenz —> Wkt oder relative Häufigkeit, mit der ein Mensch mindestens einmal im Leben positiv diagnostiziert wird
Inzidenz —> Anzahl neu hinzukommender Positiver innerhalb eines bestimmten Zeitraumes, z.B. 7-Tage Inzidenz
Bezugsnormen
Um einzuteilen, ob Ergebnisse einer Evaluationsstudie gut oder schlecht bzw. wünschenswert / nicht wünschenswert sind
Vergleich der statistischen Kennwerte PRO Merkmal, z.B. Arbeitsfähigkeit mit Bezugsmaßstäben:
Last changeda day ago