Was ist das Ziel eines guten psychologischen Tests?
Welche Kriterien sollte dieser Test erfüllen?
Das Ziel eines diagnostischen Tests/ Fragebogens ist es ein wahres, nicht direkt beobachtbares Merkmal möglichst genau abzubilden.
“möglichst genau abzubilden” = Gütekriterien erfüllen!
Etappe I: Die Entwicklung eines Tests. Wie verläuft der Weg? Gebe einen Überblick.
Schritt 2 und 3 im Detail: Definition und Vorüberlegungen.
Schritt 4 im Detail: vom Itempool zum Testentwurf.
Wie unterscheiden sich Persönlichkeitstests von Leistungstests (Wie kann man den Itempool bestücken)?
Auf welche Formulierungsregeln sollte man bei der Formulierung von Items achten?
Schritt 5,6 und 7 im Detail: Vorbereitung Datenerhebung, Datenerhebung und Datencheck.
Dreistellige Stichprobenanzahl absolutes Minimum für statistische Erprobung eines Fragebogens. Besser vierstellig
Schritt 8 im Detail: Wie läuft die statistische Itemüberprüfung ab?
Schritt 9 und 10 im Detail: Finale Itemselektion & testrevision und Abschluss der Testrevision.
Etappe II: Die Überprüfung eines Tests. Wie verläuft der Weg? Gebe einen Überblick.
Schritt 1 im Detail: Vorüberlegungen.
Schritt 2,3, und 4 im Detail: Vorbereitung, Datenerhebung und Datencheck.
Schritt 5 im Detail: Reliabilitätsanalyse. Welche zwei Maße werden hier i.d.R. berechnet und wie?
A: Interne Konsistenz
zuerst mit konfirmatorischer Faktorenanalyse CFA prüfen, ob essentiell tau-äquivalentes Messmodell (Bild) zu den empirischen Daten passt -> für jede Subskala einzeln prüfen!
falls ja: Cronbach´s Alpha berechnen
falls nein: kongenerisches Messmodell passt besser -> Omega H berechen
B: Retestreliabilität
zu zwei Messzeitpunkten erheben und Testwerte korrelieren -> Stabilität des Merkmals
Exkurs CFA: Wie ist die übliche Darstellung?
Schritt 6 im Detail: Validitätsanalyse. Welche drei Validitätsmaße werden hier angegeben und wie werden diese berechnet?
A: Inhalts- / Augenscheinvalidität
kein quantitativer Wert
hängt eng mit der Itemkonstruktion zusammen
Expertenmeinung
B: Konstruktvalidität
Passt meine Struktur? Mit CFA kontrollieren
nomologisches Netzwerk: konvergente und divergente Validität berechnen (Korrelation)
konvergent: hohe positive oder hohe negative Korrelation mit eng verwandten Konstrukt
divergent: Nullkorrelation
C: Kriteriumsvalidität
konkurrent (gleichzeitig Prädiktor und Kriterium erfassen)
prädiktive/ prognostische (erst Prädiktor dann Kriterium)
Erkläre das Reliabilitäts-Validitäts Paradoxon.
Reliabilität steigt an, wenn man die Testitems inhaltlich homogener gestaltet
Validität steigt, je besser die Items das Konstrukt inhaltlich abbilden (breiter, heterogener)
Dilemma umgehen, indem mehrere reliable/homogene Untertests/-skalen entwickelt werden, die in ihrer Gesamtheit die Breite des Konstrukts abbilden
Was ist das Problem bei der Abgrenzung von Konstrukt- und Kriteriumsvalidität?
Welche Faktoren beeinflussen die Höhe der Korrelationen?
Welche alternative Validitätseinteilung schlägt Clifton (2020) vor?
Konstrukt- und Kriteriumsvalidität nicht immer distinkte Bereiche
als konkurrente Kriteriumsvalidität können als Außenkriterien auch Testscores verwandter Konstrukte herangezogen werden, die auch zur konvergenten Konstruktvalidität genutzt wurden.
Clifton (2020): wichtige Entwicklung in der Literatur
Inkrementelle Validität: Was misst sie und womit wird verglichen? Wie geht man methodisch vor?
Wenn man neuen Test entwickelt, muss man nachweisen, dass es sinvoll ist Konstrukt mit neuem Fragebogen zu erfassen. Damit sollte Informationen erhoben werden, die über globale Dimensionen hinausgehen.
Globale Dimensionen, mit denen verglichen wird:
Was ist ein bedeutsamer Trait?
methodisches Vorgehen:
mit einer Regression ein Außenkriterium vorhersagen
einmal nur mit neuem Fragebogen
und einmal globale Dimensionen hinzunehmen
die Prädiktoren des neuen Fragebogens sollten immer noch sig. werden
Schritt 7 8, 9 und 10 im Detail: Evaluation, Normierung, Veröffentlichung
Übersetzung eines Tests: Worauf muss man hier achten?
Vorwärts- und Rückwärtsübersetzung
Qualität sichergestellt: Rückwärtsübersetzung sollte den Kern der Items aus Originalfrageoben trffen
bilinguale Übersetzter mit psychologischem Hintergrund
Itemkennwerte und Gütekriterien sollten im übersetzten Fragebögen “äquivalent” sein. Abwägung: ist die übersetzte Skala alternativlos?
Was ist das TBS-DTK? Wie ist der Ablauf?
Testbeurteilungssystem des Diagnostik- und Testkuratoriums der Föderation Deutscher Psychologenvereinigungen
gutes Beispiel: BIP 6-F
schlechtes Beispiel: Familie in Tieren
Zuletzt geändertvor 2 Jahren