Item Response Theorie

von Elise B.

Grenzen der KTT

- Anxiome sind tlw nicht empirisch prüfbar und tlw unplausibel (zb größere Messfehler in Extrembereichen = keine Unkorreliertheit von wahrem Wert und Fehler)

- Parameter Stichprobenabhängig (zb Reliablität)

- Skalenniveau nicht Prüfbar

- Homogenität (wie viele Dimensionen sind in den Items) nicht prüfbar

Beiträge KTT vs IRT

- Ohne Jede Theorie : Prüfung von Korrelationen mit Vorhersage (Kriteriumsvalidität)

- KTT und IRT: Reliabilitätsschätzung

- IRT:

o Ermittlung Skalenniveau

o Itemhomogenität (Anzahl Dimensionen)

o Erkennen abweichender Testbearbeitung

o Neuer Ansatz Itemanalyse

o Adaptives Testen

Grundannahmen Item Response Theorie

- Manifeste und latente Variable unterscheiden sich

- Manifestes Antwortverhalten formal modelliert (mathematisch beschreibbar?)

- Itemhomogenität

o Antwortverhalten einzelner Items ist nur durch latente Variable beeinflusst -> die lösungswahrscheinichkeit von zwei Items sollte innerhalb einer Gruppe mit einheitlicher Ausprägung der latenten Variable unkorreliert sein (lokale stochastische Unabhängigkeit)

- Kategorisierung Item-response-theorien

o Quantitative Latente Variable (Latent trait-Modelle)

§ Itemcharakteristische Funktion;

· Deterministisch (ab Schwellenwert springt Lösungswahrscheinlichkeit eines Items von 0 auf 1) -> Skalogramm Modell

o Modell gilt nur wenn Itemmuster IMMER Eingehalten

· Probabilistisch (In Extrembereichen asymptotisch Keine Geraden -> denn dann in Extrembereichen undefiniert oder determiniert)

o Antwortmodus

§ Dichotom -> Rasch-Modell

§ Polytom

o Qualitative Latente Variable (Latent Class Analyse)

Rasch Modell

IC Funktionen Basics

o Alle Funktionen der Items haben die selbe Form ( Lösungswahrscheinlichkeit = Exponentialfunktion (e hoch) der Differenz zwischen Fähigkeit und Itemschwierigkeit )

o Da parallele Kurven -> spezifische Objektivität der Vergleiche

§ Unterschiede In Itemschwierigkeit ist unabhängig von der Ausprägung der Latenten Variable der Personen immer gleich groß

§ Abstände/Unterschiede zwischen den Ausprägungen der Personen sind unabhängig von den bearbeiteten Items

· Dh können auch unterschiedliche Items von verschiedenen Personen bearbeitet werden  Es können Personen immer die Itemschwierigkeiten gegeben werden die am meisten Informationen liefern

Rasch Modell

Parameterschätzung

o Likelihood-funktion (wahrscheinlichkeit der Beobachteten Daten, wenn das Modell gilt)

· Sämtliche Lösungs- und nicht-Lösungswahrscheinlichkeiten aufmultiplizieren

· Bei welchen Parametern ist das maximal  wahrscheinlichkeiten am ehesten 50/50 = Maximum Likelihood funktion

· Durch Differenzbildung der Funktion  Xi und sigma um beliebige Konstante Verschiebbar Intervallskalenniveau

o Nullpunkt per Konvention: Summe aller Itemschwierigkeiten = 0  leicht unter 0, schwer über 0

· Randsummen sind „erschöpfende Statistiken“  individuelle Lösungsmuster bringen keine zusätzliche Informationen  keine Gewichtung der Testitems zulässig/überflüssig

Rasch Modell

Modellkontrollen

§ Wenn das Modell gilt sollten die Itemschwierigkeiten in allen Stichproben gleich sein

§ Chi -Quadrat- Tests (sollte nicht signifikant sein

§ Informationstheoretische Maße (Bayes und Akaike und so … no one konws, no one needs to know)

Testoptimierung

§ bei Modellgeltung unwahrscheinliche Antwortmuster

· Person Fit Indices(Abweichende Personen erkennen) : 1 Person mit abweichendem Antwortmuster (Einzelne Personen lösen item nicht, trotz eines personen Summenscores der dies

· Item Fit Indices(Schlechte Items Erkennen) : Items mit Abweichendem Antwortmuster (Schwieriges Item wird von Vielen Personen mit niedrigem Score gelöst  keine Trennschärfe)

Iteminformation und Adaptives Testen

o Iteminformation

§ Items differenzieren am besten, wenn die Itemschwierigkeit der ausprägung der latenten Variable  Steigung der Lösungswahrscheinlichkeitsfunktion = Iteminformationsfunktion

§ Summe der Iteminformationen des Tests = Testinformation  Konfidenzintervall Schwankt je nachdem wie gut die Passung zwischen Itemschwierigkeit und Personenausprägung ist

§  in Extrembereichen annahme das weniger genau gemessen wird

o Adaptives Testen

§ Immer ausloten was gelöst wird und was nicht und Items präsenteiren die in ihrer Schwierigkeit zu dem Geschätzten Personenwert passen

Beitreten

Vorschau

Author

Elise B.

Informationen

Zuletzt geändert
vor einem Jahr

Kurs melden