Das Gütekriterium Skalierung ist erfüllt, wenn …
… die laut Verrechnungsvorschriften resultierenden Testwerte die empirische Verhaltensrelation adäquat abbilden.
Warum Methoden klassischer Testtheorie kritisch?
Sie sind stichprobenabhängig
Je nachdem welche Stichprobe vorliegt, kann was anderes rauskommen , da man nur mit vorliegenden Daten arbeitet & diese miteinander vergleicht
Item-Response Theorie
Kann prüfen ob die gegebenen Verrechnungsvorschriften eines Tests zu Testwerten führen die verhaltensadäquate Relationen wiedergeben
-> Notwendigkeitsbeweis für Rasch-Modell
Rasch-Modell beschreibt…
… Wahrscheinlichkeit, dass Tp Item löst in Abhängigkeit des Personenparameters (= wahre Fähigkeit Tp) & des Itemparameters (= wahre Schwierigkeit Item)
Rasch-Modell muss gelten, wenn (& wann gilt es nicht)
…. Testwerte durch Verrechnungsmodus die empirische Verhaltensrelation adäquat abbilden
…. wenn Rasch-Modell nicht gilt ist Test nicht verrechnungsfair
Wahrscheinlichkeit leitet sich ab aus _____________ & ________________
Fähigkeit; Schwierigkeit
… die laut Verrechnungsvorschriften resultierenden Testwerte die empirischen Verhaltensrelationen abbilden
(in Bezug auf verrechnung numerischer Testwerte)
Beim Rasch-Modell ist die _________________ entscheident und nicht die jewilige ____________ der Tp, für die Wahrscheinlichkeit ob das Item gelöst wird.
Aufgabenschwierigkeit, Fähigkeit
Möglichkeiten zu prüfen ob Rasch-Modell gilt anhand konkreter Daten:
Relationen der Item(-schwierigkeits) Parameterschätzung müssen immer gleich sein, egal welche (Teil-) Stichprobe herangezogen wird
Wenn Rasch-Modell gilt, ist Anzahl gelöster Aufgaben ein faires Maß (und anders herum)
Problem (Bzgl. Rasch-Modell)
Regelmäßig erweisen sich Tests, die bei Entwicklung nicht entsprechend geprüft werden, als nicht verrechnungsfair
-> Dann misst der Test nicht eindimensional & einzelne Items erfassen was anderes, als erfasst werden soll (z.B. Geschlecht)
Last changed14 days ago