Zusammenspiel der Gütekriterien
Die Objektivität bestimmt die maximale Höhe der Reliabilität
Die Reliabilität bestimmt die maximale Höhe der Validität
Ein Messverfahren kann eine sehr hohe Objektivität und sehr hohe Reliabilität – aber keine Validität – aufweisen
Was sind Gütekriterien?
SInd Qualitätskriterien, die bei der Entwicklung, Anwendung und Interpretation von psychologischen Tests und Messinstrumenten berücksichtig
um sicherzustellen, dass diese zuverlässig und valide sind
Dienen als Maßstab für die Qualität von psychometrischen Instrumenten
Wofür sind Gütekriterien wichtig?
Verlässliche und gültige Ergebnisse: Gütekriterien helfen sicherzustellen, dass die Testergebnisse verlässlich und gültig sind, was entscheidend ist, um fundierte Entscheidungen auf der Grundlage dieser Ergebnisse zu treffen.
Vergleichbarkeit: Gütekriterien gewährleisten, dass Testergebnisse vergleichbar sind, sowohl über verschiedene Personen als auch über verschiedene Zeitpunkte hinweg.
Aussagekraft: Sie tragen dazu bei, dass die Interpretation der Testergebnisse sinnvoll und relevant ist, und erhöhen die Aussagekraft der durchgeführten Messungen.
Ethische Standards: Gütekriterien unterstützen ethische Standards, indem sie sicherstellen, dass Tests fair und objektiv sind und nicht zu Verzerrungen oder Diskriminierung führen.
Strukturübersicht
Die Qualität eines Testverfahrens zeiht sich anhand der”Stärke” seiner Gütekriterien
Objektivität
Ziel:
Grad der Unabhängigkeit der Testergebnisse vom Untersucher
Unabhängigkeit der Testergebnisse von der Testleitung.
Formen:
Durchführungsobjektivität: Gleichheit der Bedingungen z.B Klare und eindeutige Anweisungen, Gleiche Bedingungen für Teilnehmer und Standartisierte Testmaterialien
Auswertungsobjektivität: Eindeutige Auswertungsregeln ohen “Spieraum” z.B Standartisierte Auswertungsverfahren, Kriterien zur Bewertung der Testantworten müssen eindeutig definiert und Alle Bewertenden sollten angemessen geschult werden
Interpretationsobjektivität: Eindeutige Interpretationsregeln für die Test-Rohwerte und Befunde führen zu gleichen Interpretationen z.B klare und eindeutige Richtlinien für die Interpretation der Testergebnisse,
Realibilität
Zuverlässigkeit eines Test, d.h als Grad der Genauigkeit, mit der z.B eine Persönlcihekeit gemessen wird
Innere Konsistenz (Test-technische Messgenauigkeit)
In weiefern die einzelnen Fragen eines Fragebogen miteinander übereinstimmen und das selbe Merkmal messe
Aussage über die test-technische Messgenauigkeit
Split-Half-Reliabilität Methoden zur Testhalbierung:
odd-even ( Halbierung eines Tests nach geradzahligen und ungeradzahligen Aufgaben zur Bestimmung der Reliabilität)
Testzeit oder Zufall
Cronbachs Vorgehensweise:
einmalige Testvorgabe
Splittung in k-Testteile, die als äquivalent (gleichwertig) betrachtet werden (z.B 20 Itemnd = 20 Testteile)
Aussage über die technische Messgenauigkeit des Tests
Messgenauigkeit von Staubilität oder Bedungskonstanz (Messinstrumente können sein: Assisment center, Bewerbungsgespräch)
Test-Retest-Reliabilität (Wie hoch ist die Zuverlässigkeit)
Wiederholung des Test
Ein identischer Test wird an derselben Testpersonengruppe zu zwei im Abstand definierten Zeiten durchgeführt.
Die Rohwerte beider Messzeitpunkte werden korreliert. Der Korrelationskoeffizient [rtt] definiert die Reliabilitätsschätzung.
Die Bestimmung des Zeitintervalls zwischen den Messzeitpunkten kann vom Konstrukt oder anderen Effekten abhängig sein, z. B.:
- bei stabilen Eigenschaften (IQ) langer Abstand - bei Gefühlszuständen eher kurzer Abstand - Vorbeugung von Übungs- und Erinnerungseffekten
Test-Paralleltest-Reliabilität (Wie hoch ist die Zuverlässigkeit)
zweimalige Testvorgabe (Parallelform A und Parallelform B)
Vorgabe an identischer Testpersonengruppe
Signifikanzprüfung beider
Korrelationskoeffizienten
weniger Testverfahren die Parelleltest-formen ausweisen (in der berzufsbezogenen Eignungsdiagnostik z.B Intelligenz-Struktur-Test 2000R und Mathematiktest für Ausbildung und Beruf)
Validität
Bedeutung: Wenn das gemessen wird, was gemessen werden soll
Eignungsdiagnostik: Eignungs- und Anforderungsprofil aufeinander abzustimmen
Formen: inhaltliche Validität, kriterienbezogene Validität und Konstruktvalidität und Augenscheinvalidität
Inhaltliche Validität:
liegt dann vor, wenn die Testaufgabe selber einen eindeutigen Schluss auf die Fertigkeit zulässt.
Ist die Testaufgabe angemessen und repräsentativ für das, was der Test zu messen beabsichtigt?
Beispiele: Fähikeiten, Farben zu sehen, Schreibkraft muss Textverarbeitung beherschen (Mittels Probebriefe) Fahrprüfung
Beispiel:Ein Mathematiktest, der nur Addition abdeckt, hätte möglicherweise eine geringe inhaltliche Validität, wenn er beabsichtigt, die gesamte Bandbreite mathematischer Fähigkeiten zu messen.
Kriterienbezogene Validität
liegt dann vor, wenn die Testergebnisse mit einem definierten (externen) Kriterium korrelieren.
Es wird untersucht, ob der Test in der Lage ist, vorhersagen zu können, wie gut sich die Testperson in Bezug auf das Kriterium
Inner kriterienbezogene Validität:
Beispiele: ein valider Test, der dasselbe Persönlichkeitsmerkmal erfasst
Ein Eignungstest für einen Job sollte kriterienbezogene Validität aufweisen, indem die Testergebnisse mit der späteren Jobleistung der Personen korrelieren.
Äußere Kriterienbezogene Validität:
Beispiele: Berufserfolg: operationalisiert durch Einkommen/Umsatz, Anzahl der Mitarbeiter usw. (d.h. Übereinstimmung mit Realität außerhalb des Labors)
Konstrukvalidität
liegt dann vor, wenn ein Test eine hohe Beziehung zu angenommenen oder erschlossenen Eigenschaften aufweist d.h. alle Eigenschaften erfasst, die durch das Konstrukt abgebildet werden sollen
Beispiele:
Extraversion (Persönlichkeitseigenschaften)
Intelligenz: Logisches Denken, Sprachverständnis, Arbeitsgedächtnis, Verarbeitungsgeschwindigkeit • Stressresistenz
Ein Intelligenztest sollte konstruktbezogene Validität aufweisen, indem er tatsächlich die kognitiven Fähigkeiten und nicht andere Faktoren misst.
7 Methoden zu Bestimmung der Konstruktvalidität
Korrelation des Tests mit mehreren Außenkriterien
Korrelation des Tests mit Tests ähnlichen Validitätsanspruchs
Korrelation des Tests mit Tests unterschiedlichen Validitätsanspruchs
faktorenanalytische Betrachtung des zu validierenden Tests
Analyse interindividueller Unterschiede
Analyse intraindividueller Unterschiede (z.B. Schwankungen)
inhaltlich-logische Analyse der Testelemente
Augenscheinvalidität
liegt dann vor, wenn Testpersonen die Messumsetzung als inhaltlich plausibel in Bezug auf das Messziel interpretieren
macht keine Aussage über die tatsächliche Validität
bestimmt eher die Akzeptanz eines Messverfahrens durch die Testpersonen
Beispiele: Unstrukturierte Vorstellungsgespräche (geringe Validität) gelten als augenscheinvalide und kommen somit in der Eignungsdiagnostik häufig zum Einsatz
Intelligenztest (sehr hohe Validität) weisen im Rahmen der Eignungsdiagnostik bei Laien eine geringe Augenscheinvalidität auf (= geringe Akzeptanz)
Interkrementelle Validität
Synonym: Zuwachsvalidität
Bestimmung des Varianzanteils der Steigerung der Vorhersagevalidität durch die Hinzunahme eines weiteren Prädiktors
Zuletzt geändertvor einem Jahr