Was versteht man unter der additiven Verknüpfungsregel?
Additive Verknüpfung (Kompensatorische Regel)
häufigste Entscheidungsstrategie
Einzelscores werden zu Gesamtscore aufaddiert, Gesamtsumme ist relevant
ein und derselbe Gesamtwert kann durch verschiedene Merkmalskonfigurationen in den Einzeltests erreicht werden
Additive Verknüpfung erlaubt Kompensierbarkeit
Additive Verknüpfung bei Gleichgewichtung:
Y=X1+X2+X3
Additive Verknüpfung bei Ungleichgewichtung:
Y = b1 X1 + b2 X2 + b3 X3
Was versteht man unter der disjunktive Verknüpfungsregel?
Disjunktive Verknüpfung (Oder-Regel)
Es muss keine Summe der Teilkomponenten gebildet werden, es genügt entsprechend hoher Punktwert in einem der beiden Prädiktoren
dann angemessen, wenn die im Kriterium geforderte Leistung entweder auf die eine oder andere Weise erbracht werden kann.
Beispiel:
entweder man ist sehr begabt und deshalb gut in der Schule, oder man erreicht durch hohen Fleiß gute Noten in der Schule
Was versteht man unter der konjuktive Verknüpfungsregel?
Konjunktive Verknüpfung (Und-Regel)
Kompensatorische Entscheidungen sind dort unangemessen, wo in jedem Teilbereich bestimmte Mindestanforderungen vorliegen müssen.
Leistungen in dem einem und dem anderen Bereich nötig: konjunktive bzw. „und“-Strategie
Was beinhaltet das Mischkonzept?
Mischkonzept (konkunktiv – additiv)
In der Praxis oft Mischstrategien („Must-have‘s“; „Nice-to-have‘s“, 5 von 9 Symptomen, aber Symptom 1 muss dabei sein)
Was beinhalten Integrationsregeln? (Zwischenfazit)
Integration von Ergebnissen bezieht sich auf
verschiedenen Verfahren/Testinformationen innerhalb einer Hypothese
verschiedene Hypothesen (für die Beantwortung der Gesamtfragestellung)
Verknüpfungsregeln:
Additiv (Gesamtwert ist relevant, kompensatorisch),
disjunktiv (Oder-Strategie, kompensatorisch) und
konjunktiv (Und-Strategie, nicht-kompensatorisch)
Gewichtete oder ungewichtete Integration von Informationen
Gewichtung und kompensatorische Modelle (additiv, disjunktiv) bedürfen einer empirischen Basis
Was versteht man unter subjektiver (klinischer) und statistischer Urteilsbildung?
Subjektive (Klinische) Urteilsbildung
Auswahl,Gewichtungund Verknüpfung diagnostischer Informationen auf der Basis subjektiver Erfahrungen und impliziten Faktenwissens, ohne feste Vorschrift/Regeln
z.B. diagnostisches Interview
Informationen zu Symptomen, Verlauf, Vorerkrankungen, Lebensgewohnheiten...
Statistische Urteilsbildung
Auswahl, Gewichtung u. Verknüpfung diagnostischer Informationen mittels eines Algorithmus, der aus festen Regeln besteht und genau vorschreibt, wie Informationen zusammenzufassen sind
z.B. Goldberg Index
Verrechnung 5 Skalenwerte des
MMPI: Lügen + Paranoia + Schizophrenie – Hysterie – Psychasthenie
wenn > 45: „psychotisch“
Was spricht für bzw. gegen die jeweilige Strategie?
Argumente für Subjektive (Klinische) Urteilsbildung
Diagnostiker verfügen im Einzelfall über mehr Informationen/Erfahrungen (verglichen mit denen, die in Gruppenuntersuchungen berücksichtigt werden können)
Jeder Einzelfall verlangt spezifische diagnostische Informationen und eine idiografische Integration dieser Informationen
Populationsparameter wie Regressionskoeffizienten sind immer Durchschnittswerte, die nicht blind auf den Einzelfall angewendet werden können
Argumente für Statistische Urteilsbildung
Wegen begrenzter menschlicher Informationsverarbeitungskapazität sind Diagnostiker kognitiv überfordert, größere Mengen von Informationen angemessen zu integrieren
Der Diagnostiker stützt sich stattdessen auf einige wenige Informationen, die zum Zeitpunkt der diagnostischen Urteilsbildung salient sind → Urteil wird subjektiv und in Selektionskontexten unfair
Der Diagnostiker verfügt über einen begrenzten Erfahrungsschatz, der kleiner ist als die Informationen, die aus Daten von großen Stichproben gewonnen werden können
Subjektive vs. statistsiche Urteilsbildung (Zwischenfazit)
Auswahl, Gewichtung und Verknüpfung diagnostischer Informationen führen auf der Basis von Regeln, die mit statistischen Analysen empirischer Stichprobendaten gewonnen wurden, zwar nicht immer, aber in den meisten Fällen zu gleich guten oder besseren Diagnosen und Prognosen als das weniger systematische und subjektive Urteil der Diagnostiker*innen, seien sie auch noch so erfahren!
Dennoch ist und bleibt die Erfahrung des Diagnostikers unabdingbar
Daher bestenfalls Absicherungdeseigenen (klinischen) Urteilsanhand statistischer Entscheidungsregeln
Was sind richtig und falsche Entscheidungen?
Richtige Entscheidungen:
Die Nullhypothese ist richtig und wird beibehalten.
Die Nullhypothese ist falsch und wird verworfen.
Falsche Entscheidungen:
Die Nullhypothese ist richtig, wird aber verworfen
Fehler 1. Art oder α-Fehler
Die Nullhypothese ist falsch, wird aber beibehalten
Fehler 2. Art oder β-Fehler
Was versteht man unter der Sensitivität und Spezifität eines Tests?
Richtige und falsche Entscheidungen bzgl. binär kategorialer Variablen:
BILD S. 30
FN = Fehler 2. Art, d.h. Personen werden als nicht krank/ nicht geeignet... klassifiziert, obwohl sie es sind.
Sensitivität
Die Sensitivität eines Tests meint die Wahrscheinlichkeit mit der ein vorliegender positiver Zustand (im Sinne von krank, hochbegabt, geeignet) als solcher erkannt wird
FP = Fehler 1. Art d.h. Personen werden als krank/geeignet... klassifiziert, obwohl sie es nicht sind
Spezifität
Die Spezifität eines Tests meint die Wahrscheinlichkeit mit der ein vorliegender negativer Zustand (im Sinne von nicht krank, nicht hochbegabt, ungeeignet) als solcher erkannt wird.
Was versteht man unter dem Positiven und Negativen Prädiktionswert eines Tests?
Positive Prädiktionswert eines Tests:
meint den Anteil der „richtig positiv“ beurteilten (RP) an allen positiv beurteilten
positiv im Sinne von krank, hochbegabt, geeignet usw., d.h. RP+FP
Negative Prädiktionswert eines Tests:
meint den Anteil der „richtig negativ“ beurteilten (RN) an allen negativ beurteilten
negativ im Sinne von nicht krank, nicht hochbegabt, ungeeignet usw., d.h. RN+FN
Welche Rolle spielt die Basisrate/Prävalenz für den Positiven Prädiktionswert?
Beispiel: Unter Verwendung eines neuen Verfahrens zur Diagnostik von ADHS wird die Diagnose ADHS festgestellt. Der Vater fragt Sie, wie sicher diese Diagnose ist.
Bei einer Prävalenz von ungefähr 3 % und einem N von 1000 sind dies 30 Personen (=RP + FN).
Mit dem Test werden 27 davon erkannt (RP).
Die Sensitivität errechnet sich aus RP/(RP+FN) = 27/30= 0,9.
Die Sensitivität, d.h. der Anteil der als „richtig positiv“ beurteilten, beträgt demnach 90 %.
Ca. 97 % einer repräsentativen Stichprobe hat kein ADHS .
Bei einem N von 1000 sind dies 970 Personen (=RN + FP)
Mit dem Test werden 805 davon erkannt (RN).
Die Spezifität errechnet sich aus RN/(RN+FP) = 805/970 = 0,83.
Die Spezifität, d.h. der Anteil der als „richtig negativ“ beurteilten beträgt demnach 83 %.
Als „richtig positiv“ beurteilt wurden N = 27; „Falsch positiv“ beurteilt wurden N = 165 Kinder.
Somit liegt der Anteil „richtig positiv“ beurteilter an allen positiv beurteilten bei RP/RP+FP, d.h. 27/192=0,14.
Der Positive Prädiktionswert beträgt demnach 14 %.
=> D.h. die Wahrscheinlichkeit, dass der Sohn tatsächlich an ADHS erkrankt ist, ist trotz hoher Sensitivität des Tests gering.
Quintessenz:
Die Basisrate ist in sofern von Bedeutung, weil man anhand der Abbildung sieht das obwohl die Chance wenn man kein ADHS hat, welches diagnostiziert zu bekommen bei 83% immer noch 165 Personen falsch positiv (also als Krank, obwohl sie kein ADHS haben diagnostiziert werden) !!!
Wie beeinflusst die Festlegung von Cut-Off-Werten die Sensitivität von Tests?
es geht darum möglichst alle die von etwas betroffen sind, z.B. ADHS zu erwischen, in dem der Test relativ liberal wird und nicht mehr so streng ist und der Cut- off Wert heruntergesetzt wird.
je höher die Sensitivität, desto niedriger die Spezifitzität
Wie beeinflusst die Festlegung von Cut-Off-Werten die Spezifität von Tests?
hier geht es darum vor allem Personen die falsch positiv getestet wurden zu finden, indem man die cut off Werte nach oben verschiebt und die Tests strenger macht. sow wird ausgeschlossen, das wir Menschen ADHS diagnostizieren, die gar keins haben.
hohe Spezifizität bedeutet gleichzeitig niedrige Sensitivität
Wozu dient die ROC-Kurve?
ROC-Kurve = Receiver OperatingCharacteristic Curve
zeigt Verhältnis zwischen Sensitivität und Spezifität für alle mögl. Schwellenwerte an
Fläche unter der Kurve gibt Auskunft über Güte des Tests.
Je größer Fläche, desto besser Test.
Bei einem optimalen Test würde sowohl eine Sensitivität als auch eine Spezifität nahe 1 zu erwarten sein. Die Fläche unter der ROC-Kurve wäre maximiert.
nutzloser Test hat Flächenanteil nahe 0,5 (entspricht Diagonale) - Vorhersagegüte des Tests liegt dann im Zufallsbereich.
Je niedriger SW, desto höher Sensitivität und Quote falscher Alarme (d.h. niedrige Spezifität)
Anhand der ROC-Kurve wird Schwellenwert ermittelt, der beide Fehler bestmöglich reduziert.
Richtig und falsche Entscheidungen (Zwischenfazit)
Im Rahmen der psych. Diagnostik werden oft dichotome Entscheidungen getroffen
geeignet vs. ungeeignet; krank vs. nicht krank usw.
Zentrale Aufgabe:
valide Urteile und Entscheidungen zu treffen
d.h. Klassifikation stimmt mit Realität überein
Je höher die Sensitivität eines Tests/Verfahrens, desto geringer der Fehler 2. Art (FN); je höher die Spezifität, desto geringer der Fehler 1. Art (FP)
Der Positive Prädiktionswert eines Tests (=Trefferquote) gibt Auskunft über die Wahrscheinlichkeit, mit der die Klassifikation richtig ist.
Trefferquote ist abhängig von der Basisrate (Prävalenz).
Je höher die Validität eines Verfahrens, desto höher Sensitivität, Spezifität und Trefferquote.
Sensitivität/Spezifität können erhöht werden durch ein Herabsetzen/Heraufsetzen des Cut-Off-Wertes (Schwellenwertes), ab dem Klassifikation in „geeignet“, „krank“ etc. vorgenommen wird.
Zuletzt geändertvor einem Jahr