Test- und Fragebogenkonstruktion

by Lotta H.

Was ist das Ziel eines guten psychologischen Tests?

Welche Kriterien sollte dieser Test erfüllen?

Das Ziel eines diagnostischen Tests/ Fragebogens ist es ein wahres, nicht direkt beobachtbares Merkmal möglichst genau abzubilden.

“möglichst genau abzubilden” = Gütekriterien erfüllen!

Etappe I: Die Entwicklung eines Tests. Wie verläuft der Weg? Gebe einen Überblick.

Schritt 2 und 3 im Detail: Definition und Vorüberlegungen.

Schritt 4 im Detail: vom Itempool zum Testentwurf.

Wie unterscheiden sich Persönlichkeitstests von Leistungstests (Wie kann man den Itempool bestücken)?

Auf welche Formulierungsregeln sollte man bei der Formulierung von Items achten?

Schritt 5,6 und 7 im Detail: Vorbereitung Datenerhebung, Datenerhebung und Datencheck.

Dreistellige Stichprobenanzahl absolutes Minimum für statistische Erprobung eines Fragebogens. Besser vierstellig

Schritt 8 im Detail: Wie läuft die statistische Itemüberprüfung ab?

Schritt 9 und 10 im Detail: Finale Itemselektion & testrevision und Abschluss der Testrevision.

Etappe II: Die Überprüfung eines Tests. Wie verläuft der Weg? Gebe einen Überblick.

Schritt 1 im Detail: Vorüberlegungen.

Schritt 2,3, und 4 im Detail: Vorbereitung, Datenerhebung und Datencheck.

Schritt 5 im Detail: Reliabilitätsanalyse. Welche zwei Maße werden hier i.d.R. berechnet und wie?

A: Interne Konsistenz

zuerst mit konfirmatorischer Faktorenanalyse CFA prüfen, ob essentiell tau-äquivalentes Messmodell (Bild) zu den empirischen Daten passt -> für jede Subskala einzeln prüfen!
- falls ja: Cronbach´s Alpha berechnen
- falls nein: kongenerisches Messmodell passt besser -> Omega H berechen

B: Retestreliabilität

zu zwei Messzeitpunkten erheben und Testwerte korrelieren -> Stabilität des Merkmals

Exkurs CFA: Wie ist die übliche Darstellung?

Schritt 6 im Detail: Validitätsanalyse. Welche drei Validitätsmaße werden hier angegeben und wie werden diese berechnet?

A: Inhalts- / Augenscheinvalidität

kein quantitativer Wert
hängt eng mit der Itemkonstruktion zusammen
Expertenmeinung

B: Konstruktvalidität

Passt meine Struktur? Mit CFA kontrollieren

nomologisches Netzwerk: konvergente und divergente Validität berechnen (Korrelation)
- konvergent: hohe positive oder hohe negative Korrelation mit eng verwandten Konstrukt
- divergent: Nullkorrelation

C: Kriteriumsvalidität

konkurrent (gleichzeitig Prädiktor und Kriterium erfassen)
prädiktive/ prognostische (erst Prädiktor dann Kriterium)

Erkläre das Reliabilitäts-Validitäts Paradoxon.

Reliabilität steigt an, wenn man die Testitems inhaltlich homogener gestaltet
Validität steigt, je besser die Items das Konstrukt inhaltlich abbilden (breiter, heterogener)

Dilemma umgehen, indem mehrere reliable/homogene Untertests/-skalen entwickelt werden, die in ihrer Gesamtheit die Breite des Konstrukts abbilden

Was ist das Problem bei der Abgrenzung von Konstrukt- und Kriteriumsvalidität?

Welche Faktoren beeinflussen die Höhe der Korrelationen?

Welche alternative Validitätseinteilung schlägt Clifton (2020) vor?

Konstrukt- und Kriteriumsvalidität nicht immer distinkte Bereiche
als konkurrente Kriteriumsvalidität können als Außenkriterien auch Testscores verwandter Konstrukte herangezogen werden, die auch zur konvergenten Konstruktvalidität genutzt wurden.

Clifton (2020): wichtige Entwicklung in der Literatur

Inkrementelle Validität: Was misst sie und womit wird verglichen? Wie geht man methodisch vor?

Wenn man neuen Test entwickelt, muss man nachweisen, dass es sinvoll ist Konstrukt mit neuem Fragebogen zu erfassen. Damit sollte Informationen erhoben werden, die über globale Dimensionen hinausgehen.

Globale Dimensionen, mit denen verglichen wird:

Was ist ein bedeutsamer Trait?

methodisches Vorgehen:

mit einer Regression ein Außenkriterium vorhersagen
- einmal nur mit neuem Fragebogen
- und einmal globale Dimensionen hinzunehmen
die Prädiktoren des neuen Fragebogens sollten immer noch sig. werden

Schritt 7 8, 9 und 10 im Detail: Evaluation, Normierung, Veröffentlichung

Übersetzung eines Tests: Worauf muss man hier achten?

Vorwärts- und Rückwärtsübersetzung
Qualität sichergestellt: Rückwärtsübersetzung sollte den Kern der Items aus Originalfrageoben trffen
bilinguale Übersetzter mit psychologischem Hintergrund
Itemkennwerte und Gütekriterien sollten im übersetzten Fragebögen “äquivalent” sein. Abwägung: ist die übersetzte Skala alternativlos?

Was ist das TBS-DTK? Wie ist der Ablauf?

Testbeurteilungssystem des Diagnostik- und Testkuratoriums der Föderation Deutscher Psychologenvereinigungen

gutes Beispiel: BIP 6-F

schlechtes Beispiel: Familie in Tieren

Join Course

Preview

Author

Lotta H.

Information

Last changed
3 years ago

Report course