Grenzen der KTT
- Anxiome sind tlw nicht empirisch prüfbar und tlw unplausibel (zb größere Messfehler in Extrembereichen = keine Unkorreliertheit von wahrem Wert und Fehler)
- Parameter Stichprobenabhängig (zb Reliablität)
- Skalenniveau nicht Prüfbar
- Homogenität (wie viele Dimensionen sind in den Items) nicht prüfbar
Beiträge KTT vs IRT
- Ohne Jede Theorie : Prüfung von Korrelationen mit Vorhersage (Kriteriumsvalidität)
- KTT und IRT: Reliabilitätsschätzung
- IRT:
o Ermittlung Skalenniveau
o Itemhomogenität (Anzahl Dimensionen)
o Erkennen abweichender Testbearbeitung
o Neuer Ansatz Itemanalyse
o Adaptives Testen
Grundannahmen Item Response Theorie
- Manifeste und latente Variable unterscheiden sich
- Manifestes Antwortverhalten formal modelliert (mathematisch beschreibbar?)
- Itemhomogenität
o Antwortverhalten einzelner Items ist nur durch latente Variable beeinflusst -> die lösungswahrscheinichkeit von zwei Items sollte innerhalb einer Gruppe mit einheitlicher Ausprägung der latenten Variable unkorreliert sein (lokale stochastische Unabhängigkeit)
- Kategorisierung Item-response-theorien
o Quantitative Latente Variable (Latent trait-Modelle)
§ Itemcharakteristische Funktion;
· Deterministisch (ab Schwellenwert springt Lösungswahrscheinlichkeit eines Items von 0 auf 1) -> Skalogramm Modell
o Modell gilt nur wenn Itemmuster IMMER Eingehalten
· Probabilistisch (In Extrembereichen asymptotisch Keine Geraden -> denn dann in Extrembereichen undefiniert oder determiniert)
o Antwortmodus
§ Dichotom -> Rasch-Modell
§ Polytom
o Qualitative Latente Variable (Latent Class Analyse)
Rasch Modell
IC Funktionen Basics
o Alle Funktionen der Items haben die selbe Form ( Lösungswahrscheinlichkeit = Exponentialfunktion (e hoch) der Differenz zwischen Fähigkeit und Itemschwierigkeit )
o Da parallele Kurven -> spezifische Objektivität der Vergleiche
§ Unterschiede In Itemschwierigkeit ist unabhängig von der Ausprägung der Latenten Variable der Personen immer gleich groß
§ Abstände/Unterschiede zwischen den Ausprägungen der Personen sind unabhängig von den bearbeiteten Items
· Dh können auch unterschiedliche Items von verschiedenen Personen bearbeitet werden Es können Personen immer die Itemschwierigkeiten gegeben werden die am meisten Informationen liefern
Parameterschätzung
o Likelihood-funktion (wahrscheinlichkeit der Beobachteten Daten, wenn das Modell gilt)
· Sämtliche Lösungs- und nicht-Lösungswahrscheinlichkeiten aufmultiplizieren
· Bei welchen Parametern ist das maximal wahrscheinlichkeiten am ehesten 50/50 = Maximum Likelihood funktion
· Durch Differenzbildung der Funktion Xi und sigma um beliebige Konstante Verschiebbar Intervallskalenniveau
o Nullpunkt per Konvention: Summe aller Itemschwierigkeiten = 0 leicht unter 0, schwer über 0
· Randsummen sind „erschöpfende Statistiken“ individuelle Lösungsmuster bringen keine zusätzliche Informationen keine Gewichtung der Testitems zulässig/überflüssig
Modellkontrollen
§ Wenn das Modell gilt sollten die Itemschwierigkeiten in allen Stichproben gleich sein
§ Chi -Quadrat- Tests (sollte nicht signifikant sein
§ Informationstheoretische Maße (Bayes und Akaike und so … no one konws, no one needs to know)
Testoptimierung
§ bei Modellgeltung unwahrscheinliche Antwortmuster
· Person Fit Indices(Abweichende Personen erkennen) : 1 Person mit abweichendem Antwortmuster (Einzelne Personen lösen item nicht, trotz eines personen Summenscores der dies
· Item Fit Indices(Schlechte Items Erkennen) : Items mit Abweichendem Antwortmuster (Schwieriges Item wird von Vielen Personen mit niedrigem Score gelöst keine Trennschärfe)
Iteminformation und Adaptives Testen
o Iteminformation
§ Items differenzieren am besten, wenn die Itemschwierigkeit der ausprägung der latenten Variable Steigung der Lösungswahrscheinlichkeitsfunktion = Iteminformationsfunktion
§ Summe der Iteminformationen des Tests = Testinformation Konfidenzintervall Schwankt je nachdem wie gut die Passung zwischen Itemschwierigkeit und Personenausprägung ist
§ in Extrembereichen annahme das weniger genau gemessen wird
§ Immer ausloten was gelöst wird und was nicht und Items präsenteiren die in ihrer Schwierigkeit zu dem Geschätzten Personenwert passen
Zuletzt geändertvor 10 Tagen