Ziel: Messung
Realität mittels Messinstrumente in Zahlen umwandeln
Reduktion von Freiheitsgraden
Gewinn von Präzision
Messen
Die unverzerrte und exakte Abbildung von Merkmalen des Konstruktes des Interesses auf Messwerte.
Fundamentale Messung
Bestimmung der Anzahl einer gewählten Einheit in einem zu messenden Objekt, z.B. Körpergröße
Messung in Psychologie
Zuordnung von Zahlen zu Objekte / Ereignissen bzgl. der Ausprägung eines Merkmals
homomorphe Abbildung von Relationen zwischen Objekten durch Relation zwischen Zahlen
Homomorphe Abbildung
strukturerhaltende Abbildung
Gegenteil: Isomorphismus (eineindeutig)
Empirisches Relativ (Elemente, Welt wie sie ist)
Numerisches Relativ (Messung)
eineindeutige Zuordnung von Empiriker zu Numerik
Homomorphismus (eindeutig)
Empirisches Relativ und Numerisches Relativ
Zuordnung entsprechend der Eigenschaft (Element z.B. Mensch, Numerik: Noten; Abbildung Leistungsfähigkeit)
Skala
definiertes empirisches Relativ, numerisches Relativ und Abbildungsregel zwischen beiden (mit Bedingungen)
3 Bedingungen (bestimmen Art von Skala)
Repräsentationsproblem
Eindeutigkeitsproblem
Bedeutsamkeitsproblem
Eindeutigkeit/Bedeutsamkeit beschreiben ähnliches Problem
4 Skalenarten:
Nominalskala
Unterscheidung von Elementen
A sit gleich oder ungleich B, z.B. Geschlecht, Kontinent
Ordinalskala
Rangliste, keine Abstände
A ist <> als B
Intervallsskala
Rangliste, Berücksichtigung von Abständen
A ist näher an B als B an C
Verhältnisskala
Bezug auf Nullpunkt
Ausdruck von Verhältnissen
A entspricht z * B
Reaktionszeit
Messbarkeit? Skala?
Messen funktioniert bei eindimensionalen Konstrukten, mehrere Skalen für ein multidimensionales Konstrukt
Erfüllung von Ansprüchen (Axiome) an Messung durch Skala
Axiom: Grundannahme über Zusammenhänge der Skala, die im empirischen Relativ erfüllt sein müssen
Transivität: wenn a<b und b<c, ist dann a<c?
Überprüfen durch Paarvergleiche
klappt nicht z.B. bei Präferenz, multidimensionales Konstrukt
“Was darf ich mit Zahlen machen?”
zulässige Transformation unter Erhaltung von Homomorphismus/empirische Relation
Daten transformieren, ohne diese zu verändern
in Blick auf Reihenfolge / Abbildung von Rängen, keine Umkehrung
in Blick auf Verhältnisse, keine Addition, Potenzierung und Umkehrung
Messung ist eindeutig auf zulässige Transformation
“Welche Aussagen sind sinnvoll"?”
welche mathematischen Operationen führen zu sinnvollen Aussagen
Verschiedenheit
Ordnung
Intervalle
Verhältnisse
bedeutsam, wenn unter zulässigen Transformationen keine Veränderung auftritt
Gütekriterien
unverzerrte Abbildung > Objektivität
exakte Abbildung > Reliabilität
Konstruktes des Interesse > Validität
Klassische Testtheorie - Axiome
Axiome = benötigte Annahmen, um mit Daten umzugehen
Grundlage: Normalverteilung des Fehlers/der Messwerte
wahrer Wert (T), true value; Testergebnis (X), Messwert; Abweichung (E), error
X=T+E
Mittelwert M mehrer Messung nähret wahren Wert
M(E)=0; M(X) = M(T) + M(F) = T + 0 = T
E ist unabhängig von T (keine Korrelation)
E ins unabhängig von anderen T’ (keine Korrelation)
Bei Mehrfachtestung: E1 und E2 sind unabhängig
Wenn ich oft genug messe, erhalte ich das wahre Ergebnis.
Objektivität
Messergebnisse sind unabhängig vom Messenden
X = T + E
Standardisierung
Durchführungsobjektivität: Unabhängigkeitn vom Erhebenden
Standardisierende Vorbereitung
standardisierte Erhebung und Situation
Auswertungsobjektivität: Unabhängigkeit vom Auswertenden
Strukturierende Vorbereitung
Standardisierte Erhebungsinstrumente
Interpretationsobjektivität: Unabhängigkeit des Testwertes von individuellen Deutungen
Standardisierende Auswertung
Durchführungsobjektivität
drohender Validitätsverlust durch Realitätsferne und Einengung der Situation
Auswertungsobjektivität
drohender Validitätsverlust durch Realitätsferne und Einengung der Erhebung
Interpretationsobjektivität
drohender Verlust von Realibilität und Objektivität da Abhängigkeit von Versuchsleiter / Erhebendem und Auswerter
Validität
Messergebnis spiegelt akkurat wieder, was gemessen werden sollte
Problem: Wofür steht T wirklich?
Inhaltsvalidität
Erfasst meine Messung das Konstrukt in seinen wichtigsten Aspekten erschöpfend?
keine existierende formale Kritieren
Operationalisierung
Kriteriumsvalidität
Korrespondenz mit einem Außenkriterium
Zukünftige / Prognostische Validität der Messung, z.B. Intelligenz und Berufserfolg
Parallel: Übereinstimmungsvalidität (bekannte Gruppen und bekannte Merkmale)
Konstruktvalidität
Korrespondenz der Messung mit dem Bedeutungsumfang des Konstrukts
Konvergente Validität: Übereinstimmung mit anderen Messungen desselben Zielkonstrukts (Korrelation, Intelligenz und Problemlösefähigkeit)
Diskriminierung Validität: Nichtübereinstimmung zu Messungen anderer Konstrukte, die vom Zielkonstrukt unabhängig sind
Realibilität
Die Messung des Merkmals ist zuverlässig
Problem: Fehlerwert, Reduzierung von E
zwischen zwei Messungen mehrerer Personen P1-Pn (gleiche Ordnung bei mehreren Messungen)
Retestrealibilität: 2x Durchführen der gleichen Messung (Korrelation)
Instabile/zeitabhängige Merkmale
Erinnerung
Zeitlicher Aufwand
Anonymität der VPn
Paralleltestrealibilität: Durchführung von je 1 Messung mit verschieden Instrumenten (Korrelation)
Erstellen 2er Instrumente
Ergebnis: 2 reliable und 2 unreliable Instrumente
Zeitlicher Aufwand (wenn 2 benötigt)
Größenordnungen
r > 0.8 (80% T, 20% E), gut
r>0.9., hoch
zwischen zwei Teilmessungen einer Messung mehrerer Personen P1-Pn (gleiche Ordnung bei Antwort auf einzelne Fragen eines Fragebogens)
Split-half Realibilität: Aufteilung der Einzelmesswerte der Messung in 2 Teile (Korrelation)
Frage der Aufteilung
Veränderungseinflüsse innerhalb der Erhebung
Interne Konsistenz: Mittel der Übereinstmmung aller möglichen Einzelmesswertaufteilungen (Cronbachs Alpha als mittlere Korrelation aller Items)
hohes Alpha wenn Items zu ähnlich
je mehr Items, desto besser ist Alpha
Entscheiden
Entscheiden über Unterschiede
Signaldetektion
Ab wann ist gemessenes Signal existent?
Beispiel: Telefonklingeln unter der Dusche
Welchen Wert hat T wirklich, wenn ich X messe?
Lösungsansätze
gute Messung und Trennung
Maximieren des Signal/Noise Ratios
Erhöhen des Signals: Stärkere Effekte (systematische Varianz), Verringern des Rausches (Fehler-Varianz); Eingrenzen der Störeinflüsse
Erhöhen der Reliabilität
Signal Detection Theory
Kategorisierung durch Entscheidungskriterium
Correct Rejection | False Alarm | False Rejection | Hit
Gefahr für Objektivität und Validität
Verschiebung des Entscheidungskriteriums (liberal, größeres Spielfeld / konserativ, kleineres Spielfeld)
Entscheidungsproblem
Versuchspersonen und Verhaltensstrategien
Go-Nogo Task
Relevanz: Messen von Konstrukten durch Urteil der VP
Messergebnisse und statistische Signifikanz (statistisches Entscheiden)
wissenschaftliche Akzeptanz von Ergebnisse
Diagnose / Therapieentscheidungen
Last changed10 months ago