Objektivität
= Grad, in dem Ergebnisse unabhängig vom Untersucher sind
Lienert 1967
Ein Test wäre vollkommen objektiv, wenn verschiedene Untersucher bei denselben Probanden zu gleichen Ergebnissen gelangen (Interpersonelle Übereinstimmung der Untersucher)
Bsp: Führerscheinprüfung, Intelligenztests
Formales Kriterium, sagt nichts über den Inhalt aus
Arten von Objektivität
Durchführungsobjektivität
Gleiche Bedingungen für alle Prüflinge und die Untersuchung soll unabhängig von zufälligen und systemischen Verhaltensvariationen des Untersuchers sein
Maß dafür, inwieweit die Ergebnisse eines Tests von der Person des Versuchsleiters unabhängig sind. Für alle Getesteten gelten die gleichen Anforderungen unter den gleichen Bedingungen
Auswertungsobjektivität
Ergebnis unabhängig vom Untersucher
Maß dafür, inwieweit gleiches Verhalten einer Testperson stets auf die gleiche Weise ausgewertet wird
Interpretationsobjektivität
Verschiedene Beurteiler interpretieren das gleiche Auswertungsergebnis gleich (IO hoch)
Maß dafür, inwieweit die Ergebnisse eines Tests von den interpretativen Schlüssen abhängen, die ein Diagnostiker vornimmt. Eine hohe Interpretationsobjektivität besteht, wenn verschiedene Diagnostiker gewonnene Befunde in gleicher Weise interpretieren
Reliabilität
beschreibt die Zuverlässigkeit oder Präzision der Messung
Grad der Genauigkeit, mit dem er ein bestimmtes Persönlichkeits- oder Verhaltensmerkmal misst
Reliabilität ist ein Maß für die Genauigkeit, mit dem ein Test ein zu messendes Merkmal erfasst
Reliabilitätskoeffizient
Lienert & Raatz 1998
Korrelationskoeffizient der angibt, in welchem Maß unter gleichen Bedingungen gewonnene Messwerte über ein und denselben Probanden übereinstimmen, in welchem Maße das Testergebnis reproduzierbar ist
bestimmt den Grad der Zuverlässigkeit einer Messung
Statistisches Hilfsmittel, um Zusammenhänge zwischen Werten zu messen bzw. zu überprüfen -> Daten werden paarweise zusammengesetzt und mit einem Durchschnitt verglichen
Ergebnis ist ein Koeffizient zwischen -1 und +1
r = .45 (positive Korrelation, je mehr desto mehr/je weniger desto weniger)
r = 0 (kein Zusammenhang zwischen Wert x und y)
r = -80 (negative Korrelation, je weniger desto mehr/je mehr desto weniger)
Um Grad der Genauigkeit zu optimieren müssen Messfehler minimiert werden -> Verschiedene Arten von Reliabilität (Methoden)
Wiederholungsreliabilität
Erneute Messung nach einiger Zeit
= zeitliche Stabilität eines Merkmals
Split-Half-Reliabilität
Teilung der Testergebnisse im Nachhinein (nur ein Testdurchgang)
Du hast eine Umfrage erstellt, die ein Persönlichkeitsmerkmal erfassen soll. Theoretisch sollte jede deiner Fragen darauf abzielen, dieses Merkmal zu ermitteln. Du teilst den Fragebogen also in zwei Hälften und wertest die Ergebnisse parallel aus. Sind die Ergebnisse nicht ähnlich, scheint die Umfrage nicht konsistent das gleiche Merkmal abzufragen.
Paralleltestreliabilität
Verwendung mehrerer gleichartiger Testformen (Gruppe A und B bei Schulaufgabe)
Konsistenzanalyse
Zerlegung eines Tets in einzelne Items (gehört zur Reliabilität)
Validität
Der Test misst das, was er messen soll.
Ingenkamp 2008
Die Validität eines Verfahrens sagt etwas darüber aus, ob tatsächlich das Gemessen wird, was man messen will und nicht irgendetwas anderes.
Inhaltsvalidität
Test (bzw. Items) repräsentiert das zu messende Merkmal optimal.
Lukesch 1998
Spricht man von inhaltlicher Validität, so nimmt man an, dass ein Test oder dessen Elemente so beschaffen sind, dass sie das in Frage stehende Persönlichkeitsmerkmal und dergleichen in optimaler Weise repräsentieren, dass also der Test selbst das optimale Kriterium für das Persönlichkeitsmerkmal ist.
Empirische Validität
Aus Ergebnissen kann Verhalten vorhergesagt werden.
Bei der Feststellung der empirischen Validität (auch Kriteriumsvalidität genannt) steht nicht im Vordergrund, welche Eigenschaften oder Strukturen durch den Test gemessen werden sollten, sondern ob aus dem Testverhalten ein bestimmtes Verhalten vorhergesagt werden kann. Sie ist rein auf das Empirische ausgerichtet.
Konstrukt
Ein Konstrukt ist eine relativ stabile, theoretisch angenommene Eigenschaft, die nicht beobachtbar ist (z.B. Prüfungsangst, Intelligenz). Die Erfassung von Konstrukten ist nur durch die Erstellung von Theorien möglich, die festlegen, wodurch sich Konstrukte in der beobachtbaren Ebene zeigen.
Konstruktvalidität
Es wird das Konstrukt gemessen, das man messen will.
Das Instrument ist dann konstruktvalide, wenn die tatsächlich gefundenen Beziehungen mit dem theoretischen Merkmal hohe Übereinstimmung zeigen.
Testfairness
Darunter ist die Forderung zu verstehen, dass die Testitems keinen Probanden oder keine Probandengruppe benachteiligen dürfen.
Normierung
Einordnung der Ergebnisse in ein Bezugssystem
Nützlichkeit und Zumutbarkeit
Bestehendes Bedürfnis für das Verfahren
Ein Test in nützlich, wenn er ein Persönlichkeitsmerkmal misst, für dessen Untersuchung ein praktisches Bedürfnis besteht. Hohe Nützlichkeit = kein anderer Test misst dasselbe ebenso gut
Testkuratorium 1986
Die Zumutbarkeit ist ein subjektives Merkmal - sie ist das Ausmaß, in dem ein Test die getestete Person in zeitlicher, psychischer sowie körperlicher Hinsicht beansprucht.
Vergleichbarkeit
Übereinstimmung mit ähnlichen Verfahren lässt sich untersuchen.
Akzeptanz
Verfahren von der Öffentlichkeit anerkannt.
Last changed2 years ago