VL 11: IRT-1: 1,2,3, PL-Modelle

Buffl

Testen und Entscheiden

by Greta R.

1. Latent Trait Modelle mit dichotomen Antworten

Anliegen der Item Response Theorie (IRT)

Modellierung (Zerlegung) der Antwortwahrscheinlichkeit (richitg vs. Falsch) in Personen- und Itemparameter
- Personenparameter (ξv): Fähigkeit, Einstellung, Disposition…
- Itemparameter: Schwierigkeit (σi), Trennschärfe (λi), Ratewahrscheinlichkeit (ρi)
Populationsunabhängigkeit: Unabhängigkeit von Personenparametern und Itemparametern, sodass Items unabhängig von der Person und somit einer spezifischen Population interpretierbar sind.
Unidimensionalität einer Skala: Diese lässt sich (u.a.) daran festmachen, dass die Items bei Kontrolle für den Personenparamter nicht mehr korreliert sind (= lokale stochastischen Unabhängigkeit)

Erwartetes Lösemuster (Response-Pattern) bei einem unidimensionalen Test

Bei unidimensionalen Skalen sollten Items und Personen sich so anordnen lassen, dass eine „Dreiecksmatrix“ von gelösten und nicht-gelösten Items resultiert
(bei Dreiecksmatrix kann Uni Dimensionalität erwartet werden)

Items Reposne Theoretische (IRT) Modelle

Möglichkeit der Einteilung (Systematisierung) nach:
- Modellparametern
- Art der item charakteristischen Funktion
- Separierbarkeit der Modellparamter
- Art der manifesten und latenten Parameter

IRT-Modelle

Latent-Class-Modelle: Annahme qualitativer Unterschiede zwischen Personen
Latent-Trait-Modelle: Annahme kontinuierlicher latenter Variablen

Das deterministische Guttman Modell

Determinisitsche Guttman-Modell geht davon aus, dass ein Item mit Schwierigkeit (σi) nie gelöst wird, wenn Personenparameter (ξv) unter der Schwierigkeit ist (ξv < σi) und immer gelöst wird, wenn Personenparameter über Itemschwierigkeit ist (ξv > σi)

Probabilistische IC-Funktionen

Anstelle von Stufenfunktionen (wie deterministischen Guttman-Modell) gibt es bei probabilistischen Modellen monoton steigende (=S-förmige) Funktionen
Konzeptuell wird Item Schwierigkeit noch um eine (kumulative) Normalverteilung ergänzt, um zufälliges falsch und richtig antworten zu modellieren
Lord&Novick (1968): verwenden als Funktion die kumulative Normalverteilung (Normal-Ogive)
Rasch (1960) & Birnbaum (1968): mathematisch einfachere logistische Funktion:

1,2 und 3 Parameter Logistische (PL) Modelle

2. Rasch Modell, spezifische Objektivität

Das Rasch-Modell (1)

Alle Items haben gleiche Itemcharakteristische Funktion, unterscheiden sich nur in ihrer Schwierigkeit (σ)
Wenn Anstieg (Lösungswahrscheinlichkeit p=.50) bei hohen Werten (rechts; >0) erfolgt, impliziert dies, dass hohe Fähigkeit (0) notwendig ist, um Item richtig zu beantworten

Rasch-Modell (2)

Alle Items haben gleiche Itemcharakteristische Funktion, unterscheiden sich nur in ihrer Schwierigkeit (σ)
„Ein-Parameter-Logistisches Modell“ mit logistischen IC-Funktion:

𝜉𝑣 = Personenfähigkeit; 𝜎𝑖 = Item Schwierigkeit; 𝑒 = Euler’schen Zahl (2.718 …)
Item Schwierigkeit ist definiert als Merkmalausprägung (gleiche Skala!), bei der Lösungswahrscheinlichkeit 0.5 beträgt

Rasch-Modell (3)

Item-Schwierigkeit lässt sich ablesen, wenn Wendepunkt der Funktion (Punkt des steilsten Anstieges) auf X-Achse projiziert wird
Bei Modellen ohne Ratewahrscheinlichkeit liegt Wendepunkt bei p=.50 Lösewahrscheinlichkeit

Spezifische Objektivität

Im Fall der Modellgültigkeit sind alle IC-Funktionen parallel verschoben, mit dem Schwierigkeitsunterschied δ = σj – σi
Aufgrund der Parallelität der Funktionen kann Schwierigkeitsunterschied zwischen Items unabhängig von Personenfähigkeit festgestellt werden
Stichprobenunabhängigkeit
Im Umkehrschluss kann Unterschied zwischen 2 Personenparametern (ξw- ξv) unabhängig davon festgestellt werden, ob einfache oder schwere Items verwendet werden
Diese Spezifische Objektivität ist Grundlage des adaptiven Tests

Das Birnbaum 2-Parameter Modell

Als zweiter Parameter (über Item Schwierigkeit σi hinaus) kommt noch Item Diskrimination (λi) hinzu: Items diskriminieren unterschiedlich gut zwischen Personen

Birnbaum 2-Parameter Modell (2): Extrembeispiele für Diskrimination

Birnbaum 2- Parameter Modell (3)

Als 2. Parameter (über Item Schwierigkeit σi hinaus) kommt noch Item-Diskrimination (λi) hinzu:
Wird angenommen, dass Items unterschiedlich gut zwischen Personen diskriminieren, also unterschiedliche Trennschärfen für latente Merkmal ξi besitzen
Funktion des 2-Parameter-Modells ist demnach:

Birnbaum 2-Parameter-Modell weist weniger vorteilhafte Modelleigenschaften auf als 1-Parameter Rasch Modell: So besitzt es keine spezifische Objektivität

IC-Funktion des Birnbaum 2-Parameter Modells

1. Birnbaum 3-Parameter Modell

Das Birnbaum 3-Parameter Modell (1)

Das „Rate-Modell“ hat 3 Parameter: über Itemschwierigkeit (σi) und Diskrimination (λi) hinaus noch einen Parameter, der Richtig-Raten (ρi) selbst bei sehr geringer Fähigkeit erfasst

Das Birnbaum 3-Parameter Modell (2): Variation des Rateparameters (p)

Das Birnbaum 3-Parameter Modell (3)

Das „Rate-Modell“ hat 3 Parameter: über Itemschwierigkeit (σi) und Diskrimination (λi) hinaus noch einen Parameter, der Richtig-Raten (ρi) erfasst
Rate-Parameter macht Sinn für alle Testverfahren mit Multiple-Choice Format bei dem richtige Antwort auch geraten werden kann
Bei 5 Antwortalternativen wird eine Ratewahrscheinlichkeit von 20% erwartet
Allerdings wird ρi anhand der Daten geschätzt, und kann einen anderen Wert annehmen je nach Schwierigkeit der Distraktoren
Vollständige Formel lautet:

Auch das 3-Parameter-Modell weist keine spezifische Objektivität auf

- Rtwahrscheinlichkeit (ρi) null ist, reduziert sich Modell zum 2-Parameter Modell

Ratewahrscheinlichkeit und Schwierigkeit

Ratewahrscheinlichkeit „schiebt“ die sigmoidale Funktion nach oben und staucht sie

Schwierigkeit wird weiterhin am Wendepunkt (Punkt des steilsten Anstiegs) abgelesen
Hier liegt pi=.20, sodass bei p=.60 (Mitte zwischen Ratewahrscheinlichkeit und 100% Wahrscheinlichkeit) abgelesen wird.

Ratewahrscheinlichkeit „schiebt“ die sigmoidale Funktion nach oben und staucht sie
Schwierigkeit wird weiterhin am Wendepunkt (Punkt des steilsten Anstiegs) abgelesen
Beispiel: Hier liegt pi=.20, sodass bei p=.60 (Mitte zwischen Ratewahrscheinlichkeit und 100% Wahrscheinlichkeit) abgelesen wird.

5. Modellvergleich, Item- und Testinformation

1, 2, und 3 Parameter Logistische (PL) Modelle

Modellvergleich

Welches Modell beschreibt Daten am besten? (relativiert an seiner Komplexität?) -> id.r. wird ein möglichst einfaches Modell bevorzugt
Modell-Differenztests sind möglich, da Modelle genestet sind
Fit-Indizes für jedes Modell: RMSEA, CFI, TLI
Modellvergleichsindizes: AIC, BIC und Derivate

Item Charakteristik und Information

- Items sind im Bereich ihrer stärksten Steigung am informativsten (Personen-Unterschiede werden am besten diskriminiert)

Item Information Curve (IIC)

- Informationskurve (Iv|ξv bzw. Iiv) kann als Produkt bedingter Lösungs- und Nicht-Lösungswahrscheinlichkeit des Items i bei gegeben ξv berechnet werden:

- 𝐼𝑖𝑣 = 𝑃(𝑥𝑣𝑖 = 1|𝜉𝑣) ∙ 𝑄(𝑥𝑣𝑖 = 0|𝜉𝑣)

- Numerische Ausprägung Iiv der Iteminformationsfunktion ist für…

- Position der IIC: Maximum liegt bei steilstem Anstieg der ICC

- Höhe der IIC: Abflachung resultiert bei ungünstigen Item Charakteristiken wie einer geringen Diskrimination und hoher Ratewahrscheinlichkeit

Testinformationsfunktion (TIF)

Join Course

Preview

Author

Greta R.

Information

Last changed
2 years ago

Report course