Diffusionsmodelle - Was sind Mathematische Modelle (in der Psychologie)? (3)
Was sind Mathematische Modelle (in der Psychologie)?
• Mathematische Modelle ermöglichen eine formale Formulierung psychologischer
Theorien
• Ziel: Valide Beschreibung von ablaufenden latenten (kognitiven) Prozessen
• Im Gegensatz zu generischen statistischen Modellen (z.B. GLM) werden mathematische
Modelle oft spezifisch für bestimmte Aufgaben / Daten entwickelt
• Vorteile
– Präzise Definition der Theorie
– Besseres Verständnis von Wirkmechanismen (Prozesse vs. Ergebnisse)
– Ableitung präziser, überprüfbarer Hypothesen
– Theorien können besser verglichen, falsifiziert und weiterentwickelt werden
größerer Erkenntnisgewinn aus Daten
Mathematische Modellierung psychologischer Prozesse (5)
(1) Theoretische Modellentwicklung
(2) Mathematische Formulierung
(3) Anpassung des Modells an empirische Daten
• Parameterschätzung
• Bestimmung des „goodness of fit“
(4) Modellvalidierung
(5) Ggf. Anpassung / Erweiterung eines Modells
Schritt 1: Theoretische Modellentwicklung (2)
Schritt 1: Theoretische Modellentwicklung
• Beispiel: Signaldetektionstheorie (SDT, Swets & Green, 1966)
• Grundannahmen
– Die wahrgenommene Signalstärke ist durch normalverteiltes „Rauschen“ überlagert
– Ein Signal wird entdeckt, wenn die wahrgenommene Signalstärke eine Schwelle überschreitet
Schritt 2: Mathematische Formulierung (2)
Modellformeln der SDT
– Sensitivität: 𝑑′ = 𝑧 (ℎ𝑖𝑡𝑠) − 𝑧(𝑓𝑎𝑙𝑠𝑒 𝑎𝑙𝑎𝑟𝑚𝑠)
– Antworttendenz: 𝑐 = 0.5 ⋅ (𝑧 (ℎ𝑖𝑡𝑠) + 𝑧 (𝑓𝑎𝑙𝑠𝑒 𝑎𝑙𝑎𝑟𝑚𝑠))
wobei 𝑧 die Quantile der Standardnormalverteilung für den Anteil der Fläche links des z-Werts angibt
Schritt 3a: Parameterschätzung (2)
• Beispieldaten ℎ𝑖𝑡𝑠 = 0.96; 𝐹𝐴 = 0.20
• Berechnung der Modellparameter
– Sensitivität 𝑑′ = 𝑧 0.96 − 𝑧 0.36 = 1.75 − −0.84 = 2.59
– Antworttendenz 𝑐 = 0.5 ⋅ 𝑧 0.96 + 𝑧 0.36 = 0.45
Schritt 3b: Goodness-of-Fit ()
Schritt 3b: Goodness-of-Fit
• Prüfung des Goodness-of-Fit ist nur bei über-identifizierten Modellen möglich —> mehr Daten als freie Parameter
• Strategien bei fehlender Überindentifizierung
– Mehrere Versuchsbedingungen
– Parameter fixieren (z.B. über Bedingungen gleichsetzten)
Schritt 4: Modellvalidierung ()
Schritt 4: Modellvalidierung
• Strategie 1: Schätzung der Kriteriums- Prädiktiven- oder Konstruktvalidität
– Korrelieren die Modellparameter in erwarteter Weise mit externen Kriterien?
– Beispiel: negativer Zusammenhang von 𝑑‘ und Lebensalter?
• Strategie 2: Experimentelle Validierung („Selective Influence Studies“)
– Haben experimentelle Manipulationen erwartete Effekte?
– Beispiel 1: Je schwächer die Stimulusintensität, desto kleiner 𝑑′
– Beispiel 2: Je mehr Treffer (hits) belohnt werden, desto höher 𝑐; je mehr Falsche Alarme (false alarms) bestraft werden, desto kleiner wird 𝑐
—>„Selective Influence Studies” (Experimentelle Manipulationen beeinflussen einzelne Parameter)
Schritt 5: Anpassung eines Modells (3)
Schritt 5: Anpassung eines Modells
• Wann sollten mathematische Modelle angepasst werden?
1. Der Goodness-of-Fit ist unbefriedigend
2. Die Validität der Parameter kann nicht bestätigt werden
• Mögliche Modellanpassungen
– Änderung der mathematischen Annahmen
(z.B. Annahme eine Cauchy Verteilung statt einer Normalverteilung für die wahrgenommenen Stimulusintensität)
– Modellerweiterungen: z.B. Annahme zusätzlicher Prozesse
—>Aufnahme zusätzlicher Parameter (z.B. unterschiedlichen Varianzen für „alte“ und „neue“ Stimuli in der SDT)
– Einschränkung des Gültigkeitsbereichs einer Theorie
—>Angaben von Randbedingungen
– …
Diffusionsmodelle (3)
• Diffusionsmodelle bilden eine Theorie über kognitive Prozesse bei schnellen binären Entscheidungen
• Es werden Reaktionen und Reaktionszeiten modelliert
• Wichtige Vorteile gegenüber einer Auswertung der mittleren Reaktionszeiten oder Fehlerraten
1. Fehler und RTs werden in einer Analyse berücksichtigt
2. Trials werden nicht aggregiert sondern einzeln berücksichtigt
3. Parameter bilden distinkte kognitive Prozesse ab („Warum sind Personen in einer Bedingung schneller als in einer anderen?)
− Geschwindigkeit der Informationsverarbeitung
− Reaktionsschwelle (Speed-Accuracy-Tradeoff)
− Dauer motorischer Prozesse
− …
Theoretische Annahmen des Diffusionsmodells (3)
Theoretische Annahmen des Diffusionsmodells ()
• Binäre Entscheidungen
– Es gibt genau zwei Antwortalternativen
– Oder Antworten werden umkodiert als „korrekt“ vs. „falsch“
• Einstufige Entscheidungen mit kontinuierliche Informationsaufnahme
– Gleiche Geschwindigkeit der Informationsaufnahme während des gesamten
Entscheidungsprozesses
– Vermutlich nicht geeignet sind Situationen, die komplexes Problemlösen
erfordern
• Konstante Parameterwerte während einer Entscheidung
– Konstante Geschwindigkeit der Informationsaufnahme (drift)
– Konstanter Speed/Accuracy Tradeoff (Schwellenabstand)
Das (vereinfachte) Diffusionsmodelle ()
Modellparameter: Drift (3)
Modellparameter
• Drift (v)
– Die Drift ist ein Maß für die durchschnittliche Geschwindigkeit der Informationsverarbeitung
– Vergleich von Personen: „cognitive speed“
– Vergleich von Bedingungen: „task difficulty“
– Beispielbefund: Positive Korrelation von Drift und Intelligenz (z.B. Lerche, von Krause, Voss, Frischkorn, Schubert & Hagemann, 2020))
Modellparameter: Schwellenabstand (3)
Schwellenabstand (a)
– Der Schwellenabstand misst die Informationsmenge, die für die Entscheidung benötigt wird
– Hohe Werte: Konservativer Entscheidungsstil (langsame Reaktionen, wenig Fehler)
– Niedrige Werte: Liberaler Entscheidungsstil (schnelle Reaktionen, viele Fehler)
– Beispielbefund: Ältere Probanden wählen konservativere Entscheidungsschwellen (z.B. Theisen, Lerche, von Krause, & Voss, 2020)
Modellparameter: Startpunkt (3)
Startpunkt (z)
– Der Startpunkt bildet einen Antwort-Bias für eine der Reaktionen ab
– Je mehr eine Reaktion bevorzugt wird, desto näher startet der
Entscheidungsprozess bei der zugehörigen Schwelle
– Beispielbefund: Wenn ein Stimulus zu höherem Gewinn führt, wird der Startpunkt zu dieser Schwelle verschoben (z.B. Voss, Rothermund, & Brandtstädter, 2008)
Modellparameter: Reaktionszeitkonstante (3)
Reaktionszeitkonstante (t0)
– Die Reaktionszeitkonstante fasst die Dauer aller nicht-entscheidungsbezogenen Prozesse zusammen
– Enkodierung und Motorische Reaktionsausführung
– Beispielbefund: Höhere t0-Werte bei älteren Probanden (z.B. Theisen, Lerche, von Krause, & Voss, 2020)
Vorhergesagte Reaktionszeitverteilungen ()
Vorhergesagte Reaktionszeitverteilungen
• Vergleichsmodell (grau): 𝑎 = 1, 𝑣 = 1, 𝑧 = 0.5, 𝑡0 = 0.5
Parameterschätzung (3)
• Vorhergesagten Reaktionszeitverteilungen sollen optimal zu empirischen Daten passen
• Unterschiedliche Optimierungskriterien
– Maximum Likelihood
• Effizient bei kleinen Trialzahlen (<100 Durchgänge)
• Anfällig gegenüber Ausreißern
• Kann auch für Bayesianische Parameterschätzung verwendet werden
– Chi² Schätzer
• Sehr große Trialzahlen notwendig (mind. 500 Durchgänge)
• Robust gegenüber Ausreißern
• Sehr schnelle Berechnung
– Kolmogorov-Smirnov-Statistik
• Moderate Trialzahlen sind ausreichend (>100 Durchgänge)
• Sehr robust gegenüber Ausreißern
Programme zur Modellschätzung (4)
Programme zur Modellschätzung
• EZ-Diffusion (Wagenmakers et al., 2008; Wagenmakers et al., 2007)
– Einfache Schätzung der zentralen Modellparameter auf Basis der mittleren
Reaktionszeiten, Varianz, und Fehlerprozente
• fast-dm (Voss & Voss, 2007, 2008)
– Kommandozeilen-Programm zur Parameterschätzung
– Es kann zwischen der Maximum-Likelihood, Chi² oder Kolmogorov-Smirnov
Methode gewählt werden
• HDDM (Wiecky, Sofer & Frank, 2013)
– Python Programm zur (hierarchischen) Bayesianischen Parameterschätzung
• Eine Bayesianischen Parameterschätzung ist auch mit stanmöglich
Einführung in fast-dm ()
• fast-dm ist ein Kommandozeilen-Programm ohne Benutzeroberfläche
• Beim Start wird eine Kontrolldatei (experiment.ctl) gelesen, die alle weiteren
Befehle enthält
• In dieser Kontrolldatei wird definiert …
– welche Schätzmethode verwendet wird
– welche Parameter geschätzt werden, und welche auf feste Werte fixiert werden
– welche Parameter zwischen Versuchsbedingungen variieren dürfen
– welches Format die Datendateien haben
– welche Daten eingelesen werden sollen
– wo die Ergebnisse gespeichert werden
fast-Ausgabe: log files
• fast-dm schätzt die Parameter pro Person und speichert diese in einer Log-Datei
• Die Parameter können dann mit einem Statistikprogramm (als neue AVn) ausgewertet werden
Zusammenfassung ()
Zusammenfassung
• Mathematische Modelle stellen die mathematische Definition einer Theorie dar
• Solche Modelle können anhand ihres Goodness of Fits und der Validität der
Parameter beurteilt werden
• Das Diffusionsmodelle bildet eine Theorie für binäre Entscheidungen ab
• Grundannahme ist, dass Information kontinuierlich aufgenommen wird, bis der
Entscheidungsprozess eine von zwei Schwellen erreicht
• Die wichtigsten Modellparameter sind
– Geschwindigkeit der Informationsaufnahme (Drift: 𝑣)
– Entscheidungsstil (Schwellenabstand 𝑎 und Startpunkt 𝑧)
– Dauer der nicht-entscheidungsbezogener Prozesse (RT-Konstante 𝑡0)
• Die Parameterschätzung kann (z.B. mit fast-dm) durch Optimierung der Likelihood,
des Chi² Kriteriums oder der Kolmogorov-Smirnov Statistik erfolgen
• Neuerdings werden häufig auch Bayesianische Methoden zur Parameterschätzung
verwendet (z.B. HDDM, stan)
Last changed2 years ago