Buffl uses cookies to provide you with a better experience. You can find more information in our privacy policy.
1. Latent Trait Modelle mit dichotomen Antworten
Anliegen der Item Response Theorie (IRT)
Modellierung (Zerlegung) der Antwortwahrscheinlichkeit (richitg vs. Falsch) in Personen- und Itemparameter
Personenparameter (ξv): Fähigkeit, Einstellung, Disposition…
Itemparameter: Schwierigkeit (σi), Trennschärfe (λi), Ratewahrscheinlichkeit (ρi)
Populationsunabhängigkeit: Unabhängigkeit von Personenparametern und Itemparametern, sodass Items unabhängig von der Person und somit einer spezifischen Population interpretierbar sind.
Unidimensionalität einer Skala: Diese lässt sich (u.a.) daran festmachen, dass die Items bei Kontrolle für den Personenparamter nicht mehr korreliert sind (= lokale stochastischen Unabhängigkeit)
Erwartetes Lösemuster (Response-Pattern) bei einem unidimensionalen Test
Bei unidimensionalen Skalen sollten Items und Personen sich so anordnen lassen, dass eine „Dreiecksmatrix“ von gelösten und nicht-gelösten Items resultiert
(bei Dreiecksmatrix kann Uni Dimensionalität erwartet werden)
Items Reposne Theoretische (IRT) Modelle
Möglichkeit der Einteilung (Systematisierung) nach:
Modellparametern
Art der item charakteristischen Funktion
Separierbarkeit der Modellparamter
Art der manifesten und latenten Parameter
IRT-Modelle
Latent-Class-Modelle: Annahme qualitativer Unterschiede zwischen Personen
Latent-Trait-Modelle: Annahme kontinuierlicher latenter Variablen
Das deterministische Guttman Modell
Determinisitsche Guttman-Modell geht davon aus, dass ein Item mit Schwierigkeit (σi) nie gelöst wird, wenn Personenparameter (ξv) unter der Schwierigkeit ist (ξv < σi) und immer gelöst wird, wenn Personenparameter über Itemschwierigkeit ist (ξv > σi)
Probabilistische IC-Funktionen
Anstelle von Stufenfunktionen (wie deterministischen Guttman-Modell) gibt es bei probabilistischen Modellen monoton steigende (=S-förmige) Funktionen
Konzeptuell wird Item Schwierigkeit noch um eine (kumulative) Normalverteilung ergänzt, um zufälliges falsch und richtig antworten zu modellieren
Lord&Novick (1968): verwenden als Funktion die kumulative Normalverteilung (Normal-Ogive)
Rasch (1960) & Birnbaum (1968): mathematisch einfachere logistische Funktion:
1,2 und 3 Parameter Logistische (PL) Modelle
2. Rasch Modell, spezifische Objektivität
Das Rasch-Modell (1)
Alle Items haben gleiche Itemcharakteristische Funktion, unterscheiden sich nur in ihrer Schwierigkeit (σ)
Wenn Anstieg (Lösungswahrscheinlichkeit p=.50) bei hohen Werten (rechts; >0) erfolgt, impliziert dies, dass hohe Fähigkeit (0) notwendig ist, um Item richtig zu beantworten
Rasch-Modell (2)
„Ein-Parameter-Logistisches Modell“ mit logistischen IC-Funktion:
𝜉𝑣 = Personenfähigkeit; 𝜎𝑖 = Item Schwierigkeit; 𝑒 = Euler’schen Zahl (2.718 …)
Item Schwierigkeit ist definiert als Merkmalausprägung (gleiche Skala!), bei der Lösungswahrscheinlichkeit 0.5 beträgt
Rasch-Modell (3)
Item-Schwierigkeit lässt sich ablesen, wenn Wendepunkt der Funktion (Punkt des steilsten Anstieges) auf X-Achse projiziert wird
Bei Modellen ohne Ratewahrscheinlichkeit liegt Wendepunkt bei p=.50 Lösewahrscheinlichkeit
Spezifische Objektivität
Im Fall der Modellgültigkeit sind alle IC-Funktionen parallel verschoben, mit dem Schwierigkeitsunterschied δ = σj – σi
Aufgrund der Parallelität der Funktionen kann Schwierigkeitsunterschied zwischen Items unabhängig von Personenfähigkeit festgestellt werden
Stichprobenunabhängigkeit
Im Umkehrschluss kann Unterschied zwischen 2 Personenparametern (ξw- ξv) unabhängig davon festgestellt werden, ob einfache oder schwere Items verwendet werden
Diese Spezifische Objektivität ist Grundlage des adaptiven Tests
Das Birnbaum 2-Parameter Modell
Als zweiter Parameter (über Item Schwierigkeit σi hinaus) kommt noch Item Diskrimination (λi) hinzu: Items diskriminieren unterschiedlich gut zwischen Personen
Birnbaum 2-Parameter Modell (2): Extrembeispiele für Diskrimination
Birnbaum 2- Parameter Modell (3)
Als 2. Parameter (über Item Schwierigkeit σi hinaus) kommt noch Item-Diskrimination (λi) hinzu:
Wird angenommen, dass Items unterschiedlich gut zwischen Personen diskriminieren, also unterschiedliche Trennschärfen für latente Merkmal ξi besitzen
Funktion des 2-Parameter-Modells ist demnach:
Birnbaum 2-Parameter-Modell weist weniger vorteilhafte Modelleigenschaften auf als 1-Parameter Rasch Modell: So besitzt es keine spezifische Objektivität
IC-Funktion des Birnbaum 2-Parameter Modells
1. Birnbaum 3-Parameter Modell
Das Birnbaum 3-Parameter Modell (1)
Das „Rate-Modell“ hat 3 Parameter: über Itemschwierigkeit (σi) und Diskrimination (λi) hinaus noch einen Parameter, der Richtig-Raten (ρi) selbst bei sehr geringer Fähigkeit erfasst
Das Birnbaum 3-Parameter Modell (2): Variation des Rateparameters (p)
Das Birnbaum 3-Parameter Modell (3)
Das „Rate-Modell“ hat 3 Parameter: über Itemschwierigkeit (σi) und Diskrimination (λi) hinaus noch einen Parameter, der Richtig-Raten (ρi) erfasst
Rate-Parameter macht Sinn für alle Testverfahren mit Multiple-Choice Format bei dem richtige Antwort auch geraten werden kann
Bei 5 Antwortalternativen wird eine Ratewahrscheinlichkeit von 20% erwartet
Allerdings wird ρi anhand der Daten geschätzt, und kann einen anderen Wert annehmen je nach Schwierigkeit der Distraktoren
Vollständige Formel lautet:
-
Auch das 3-Parameter-Modell weist keine spezifische Objektivität auf
- Rtwahrscheinlichkeit (ρi) null ist, reduziert sich Modell zum 2-Parameter Modell
Ratewahrscheinlichkeit und Schwierigkeit
Ratewahrscheinlichkeit „schiebt“ die sigmoidale Funktion nach oben und staucht sie
Schwierigkeit wird weiterhin am Wendepunkt (Punkt des steilsten Anstiegs) abgelesen
Hier liegt pi=.20, sodass bei p=.60 (Mitte zwischen Ratewahrscheinlichkeit und 100% Wahrscheinlichkeit) abgelesen wird.
Beispiel: Hier liegt pi=.20, sodass bei p=.60 (Mitte zwischen Ratewahrscheinlichkeit und 100% Wahrscheinlichkeit) abgelesen wird.
5. Modellvergleich, Item- und Testinformation
1, 2, und 3 Parameter Logistische (PL) Modelle
Modellvergleich
Welches Modell beschreibt Daten am besten? (relativiert an seiner Komplexität?) -> id.r. wird ein möglichst einfaches Modell bevorzugt
Modell-Differenztests sind möglich, da Modelle genestet sind
Fit-Indizes für jedes Modell: RMSEA, CFI, TLI
Modellvergleichsindizes: AIC, BIC und Derivate
Item Charakteristik und Information
- Items sind im Bereich ihrer stärksten Steigung am informativsten (Personen-Unterschiede werden am besten diskriminiert)
Item Information Curve (IIC)
- Informationskurve (Iv|ξv bzw. Iiv) kann als Produkt bedingter Lösungs- und Nicht-Lösungswahrscheinlichkeit des Items i bei gegeben ξv berechnet werden:
- 𝐼𝑖𝑣 = 𝑃(𝑥𝑣𝑖 = 1|𝜉𝑣) ∙ 𝑄(𝑥𝑣𝑖 = 0|𝜉𝑣)
- Numerische Ausprägung Iiv der Iteminformationsfunktion ist für…
- Position der IIC: Maximum liegt bei steilstem Anstieg der ICC
- Höhe der IIC: Abflachung resultiert bei ungünstigen Item Charakteristiken wie einer geringen Diskrimination und hoher Ratewahrscheinlichkeit
Testinformationsfunktion (TIF)
Last changed8 months ago