Was versteht man unter Tests?
Definition:
Ein Test ist ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage über den relativen Grad der individuellen Merkmalsausprägung.“
Welche Art von Leistungstests gibt es?
Entwicklungstests:
Verfahren, die den Leistungs- stand eines Kindes in Relation zum Lebensalter erfassen
z.B. WET: Wiener Entwicklungstest
Schultests:
Schuleingangs-/Schulreifetests
Ziel: Erfassung von für Erbringen schulischer Leistungen notwendiger Fertigkeiten und Fähigkeiten
Typische Aufgaben: z.B. Nachmalen von Formen, Mann-Zeichnungen, Markieren von Bildern nach Sprach- verständnis für Einzelsituationen
z.B.: Screening des Entwick- lungsstandes bei Einschulungsuntersuchungen
Schulleistungstests (u.a. Lese-, Rechtschreib- und Rechentests)
objektive Leistungsbeurteilung unter standardisierten Bedingungen und anhand überregionaler Normen;
Hinweise auf spezifische Lernprobleme u. Teilleistungsschwächen (Legasthenie, Dyskalkulie oder Rechenschwäche)
z.B.: Zareki-R: Testverfahren zur Erfassung einer Dyskalkulie bei Grundschulkindern
Aufmerksamkeits-/ Konzentrationstests:
sind in vielen Anwendungsbereichen von hoher Relevanz
Intelligenztests:
messen (kognitive) Leistungsfähigkeit eines Individuums in Abhängigkeit von der unterliegenden Intelligenzdefinition
Einordnung u.a. nach:
Messintention / Anwendungskontext:
Globalmaß oder Intelligenzstruktur
sprachfreie / kulturfaire Messung oder bildungsabhängig messen
Durchführungsbedingungen
Einzel- oder Gruppentestung
Papier- und Bleistift oder Computertest
Speed- oder Powertest
Zielgruppe
Welche typischen Kennwerte liefern Aufmerksamkeits- und Konzentrationstests?
Arten von Aufmerksamkeits- und Konzentrationstests allgemein
Durchstreichverfahren (Suchen nach Reizdiskrimination)
Aus Vielzahl ähnlicher Reize relevante anstreichen, irrelevante nicht
Z.B.: d2, FAIR
Sortierverfahren
Sortieren von z.B. Karten nach per Instruktion festgelegten Kriterien
Z.B.: Konzentrations-Verlaufs-Test (KVT)
Rechenverfahren
Einfache Rechenaufgaben lösen
Z.B.: Revisionstest
Transformationsverfahren
Umwandeln von z.B. Zahlen in Symbole nach Umwandlungstabelle
In Intelligenztests enthalten: z.B.Wechsler-Tests, Zahlen-Symbol-Test des Berliner Intelligenz Strukturtest (BIS)
Charakteristika von Aufmerksamkeits- und Konzentrationstests allgemein
Bearbeitung einfacher Aufgaben
Klar wahrnehmbare Reize
Einfach zu erinnernde Regeln
Erschwerende Bedingungen
Störreize
Zeitdruck
Lange Arbeitszeit
Kennwerte
Arbeitstempo (Anzahl bearbeiteter Aufgaben, Reaktionszeit; Quantität)
Genauigkeit (Auslassungsfehler; Verwechslungsfehler; Qualität)
Was und wie misst der d2-R?
Was misst der d2-R und für welche Anwendungsbereiche ist er geeignet?
Aufmerksamkeit und Konzentrationsfähigkeit (maximale Performanz)
Verwendung in nahezu allen psychologischen Arbeitsbereichen
Zielgruppe: 8;0 bis 79;11 Jahre
Testaufbau/Durchführung Paper Pencil
Gehört zu Durchstreichverfahren
Aufgabe: alle d durchstreichen, sofern sie mit zwei Strichen versehen sind
Bearbeitungsdauer: ca. 10 Minuten (davon 5 min reine Bearbeitungszeit)
Wie sieht die psychometrische Güte des d2-R aus?
Objektivität
Standardisierte Instruktion, genaue Anweisungen für die Übungsaufgaben
Detaillierte Hinweise für besondere Testsituationen im Manual
Klare Vorgaben zur Auswertung und Interpretation (inkl. Angaben zur Ermittlung der Konfidenzintervalle)
Fazit:Durchführungs-, Auswertungs-und Interpretationsobjektivitätist gegeben
Reliabilität
interne Konsistenz (Cronbachs alpha und Testhalbierung) für alle Kennwerte hoch um .80/.90
Retestreliabilitäten nach 1 Tag und 10 Tagen hoch (aber abhängig vom Kennwert, am geringsten für Genauigkeitsmaß r = .47)
Geringfügige Übungseffekte insb. bei kurzem Retestintervall (1 Tag)
Fazit: Reliabilität mit Blick auf verschieden Indikatoren gegeben
Validität
Korrelationen mit anderen Konzentrationstest (konvergente Validität)
Korrelationen mit IQ-Tests, Leistungsmotivation und motorischer Schnelligkeit meist gering (r<.30) , (diskriminante Validität)
Kriteriumsvalidität anhand Verhaltensindikatoren, Gruppenunterschieden
Verkehrspsychologie: Assoziation mit Unfallwahrscheinlichkeit
Klinische Psychologie: geringere Werte in Patient*innengruppen als in Kontrollgruppen
Keine bedeutsame Assoziation zwischen d2-Testergebnis und Ausbildungserfolg 4 Jahre später
Fazit: zahlreiche Validitätsnachweise erbracht
Normierung
Paper-Pencil Version: In 2007/2008 anhand von ca. 4000 Personen im Altersbereich von 9-60 Jahren normiert
Differenzierung nach 7 Altersklassen
Nicht repräsentativ: überwiegend (75%) junge Personen (bis 19 Jahre)
elektronische Version: in 2015 anhand von ca. 3000 Personen im Alter von 8 – 79 Jahren normiert
Differenzierung nach 16 Altersklassen
Repräsentativ hinsichtlich des Bildungsgrads
Für elektronische Version existieren zusätzlich repräsentative Daten einer europäischen Normstichprobe N = 2100) im Alter von 18 – 55 Jahren
Was sind Vor- und Nachteile des d2-R?
Vorteile:
sehr ökonomisch (einfach durchführbar, kurze Bearbeitungsdauer, Gruppentestung möglich)
Hohe psychometrische Güte
Nur in geringem Maße abhängig von verbalen und numerischen Fertigkeiten – relativ kulturfair
Grenzen/Kritik:
Keine Normtabellen für Extremgruppen (z.B. klinische Stichproben) und ältere Menschen
Feinmotorik sowie gutes Sehvermögen nötig
kurzfristige Übungseffekte
misst kurzzeitige Aufmerksamkeits -/Konzentrationsleistung – für Frage nach Vigilanz begrenzte Aussagekraft
Was ist der Unterschied zwischen Speed und Powertests?
Speedtests
Viele leichte oder maximal mittelschwere Aufgaben, die von jedem gelöst werden könnten
Zeitbegrenzung: keine komplette Beantwortung möglich
Anzahl richtig bearbeiteter Aufgaben wird gewertet
z. B. Test d2 zur Erfassung von Konzentration u. Aufmerksamkeit
Powertests
Aufgaben, die im Schwierigkeitsgrad kontinuierlich ansteigen
nicht für alle Probanden komplett richtig zu lösen
Keine oder großzügige Zeitbegrenzung
z. B. APM zur Erfassung der Allgemeinen Intelligenz
Mischformen (zeitbegrenzte Powertests)
z. B. I-S-T 2000 R zur Erfassung der Intelligenzstruktur
Was messen ausgewählte Intelligenztests und für welche Anwendungskontexte sind sie daher insbesondere geeignet?
Grundintelligenztest Skala 2 – Revision (CFT 20-R):
dient der sprachfreien (kulturfairen) Erfassung der fluiden Intelligenz im Sinne von Cattell
Normdaten für 8;5 bis 60 Jährige
Paper-Pencil und elektronisch
Gruppentestung möglich
zeitbegrenzter Powertest
Besteht aus 2 Teilen (1. Testhälfte: 56 Items, 2. Testhälfte: 45 Items)
Dauer: nur Teil 1 => ca. 30 Minuten; Teil 1 und 2: => ca. 50 Minuten
Testmaterial enthält zudem Wortschatztest und Zahlenfolgetest zur Messung kristallisierter Intelligenz (= durch Sozialisation erworbenes Wissen)
Wechsler Intelligence Scale for Children – Fifth Edition (WISC-V):
früher Hamburg-Wechsler-Intelligenztests für Kinder (HAWIK)
weltweit am häufigsten eingesetzter Intelligenztest für Kinder und Jugendliche der Altersgruppe von 6;0 bis 16;11 Jahren
misst mittels 15 Untertests die folgenden 6 Kennwerte:
Arbeitsgedächtnis, Sprachverständnis, Verarbeitungsgeschwindigkeit, Visuell-räumliches Denken, Fluides Schlussfolgern, Gesamt-IQ-Wert
Bearbeitungsdauer: 60 bis 90 min
Profilanalyse, umgezielte Aussage über Stärken und Schwächen eines Kindes vorzunehmen
nur Einzeltestung möglich, keine Paralleltests nur Paper-Pencil-Version
Standard Progressive Matrices (SPM):
Erfassung der allgemeinen Intelligenz (g-Faktor)
Messung relativ frei von kulturellen und sprachlichen Einflüssen
fünf Sets mit je zwölf Matrizen (ohne Zeitbegrenzung)
„Progressive“ = Matrizen sind fortwährend schwerer zu lösen
Intelligenz-Struktur-Test 2000 R (I-S-T 2000 R):
Zielpopulation: 15-60 Jährige, deutsche Sprachkenntnisse
Erfassung grundlegender Intelligenzkomponenten:
Verbale, numerische und figurale Intelligenz, Merkfähigkeit
schlussfolgerndes Denken und Wissen
Fluide und kristallisierte Intelligenz
Zeitbegrenzter Powertest
Paper und Pencil sowie digitale Version
Bearbeitungsdauer: ca. 90 min (nur Grundmodul) bis 140 min (inkl. Wissenstest)
Gute Normbasis (insgesamt N = 3.484 für Form A/B; N = 2.363 für Form C = echte Parallelversion)
Differenzierung nach 8 Altersgruppen,
Differenzierung nach Schultyp (Gymnasiasten vs. Nicht-Gymnasiasten)
Von welchen Faktoren kann das Testergebnis in Leistungstests beeinflusst sein?
Intelligenz des Individuums
Konzentration
Motivation
Vertrautheit mit dem Material/Übung
Müdigkeit/Tagesform, zirkadianer Rhythmus
Testangst
Fehler bei Durchführung, Auswertung und Interpretation
Wetter
Lichtverhältnisse
Zuletzt geändertvor 2 Jahren