Wie wird die Häufigkeit beobachteter Ereignisse bestimmt?
durch Zählen
Was erlaubt das Messen?
Messen erlaubt uns eine feinere, abgestufte Erfassung von Merkmalsausprägungen
Ziel des Messens
Ausprägung eines Merkmals, das bei Untersuchungsgegenständen (Personen) vorliegt, ermitteln und der Merkmalsausprägung einen numerischen Wert zuweisen.
Diskrete Merkmale
Ein Merkmal, das nur die Erfassung der Häufigkeit in ganzen Zahlen zulässt, wird diskret genannt. Diskrete Merkmale wie z.B. die Anzahl von Geschwistern lassen also das Zählen der Auftretenshäufigkeit zu, nicht jedoch die Feststellung von feinen Ausprägungen zwischen ganzen Zahlen.
Stetige Merkmale
Ein Merkmal, das prinzipiell unendlich viele Ausprägungen annehmen kann und keine Erfassung der Häufigkeit in ganzen Zahlen zulässt, wird als stetig bzw. kontinuierlich bezeichnet. Kontinuierliche Merkmale wie z.B. die Körpergröße können nicht gezählt, wohl aber gemessen werden.
Zuordnungsregeln und Relationen
Relationen zwischen den Zahlen sollen analoge empirische Beziehungen abbilden. MöglicheRelationen sind “gleich”, “größer als”, “doppelt so viel wie” etc.
Relation (Messen auf Nominalskalenniveau)
stellt die Objekte in ein Verhältnis zueinander (Sie kennen: =, <, > für Zahlen) und ist formal die Menge von Paaren aus U, für die die Relation gilt; im Beispiel: {(Anna, Anna), (Anna, Viola), (Anna, Sara), ..., (Can, Can)}
Relationsvorschrift
verbalisiert den Vergleich; im Beispiel: „Objekt a hat dasselbe Geschlecht wie Objekt b“
Relativ
Menge der Objekte und zugehörige Relationen werden gemeinsam als Relativ zusammengefasst
Im Beispiel:
Menge U: {Anna, Viola, Sara, Luis, Can}
Relationsvorschrift: a hat das gleiche Geschlecht wie b
Relation: {<Anna, Anna>,<Anna, Viola>,<Anna, Sara>,...,<Luis,Luis>}
Relativ: Menge und diese eine Relation
empirisches vs. nummerisches Relativ
Empirisches Relativ: Menge des Relativs besteht aus Objekten
Menge U besteht aus Personen
Relation gibt Verhältnisse zwischen Personen
Nummerisches Relativ: Menge des Relativs besteht aus Zahlen
Menge R (reelle Zahlen)
Relation verbindet reelle Zahlen
Bsp. Gleichheitsrelation, Größer-Relation, Kleiner-Relation
Messen
Zuordnung von Zahlen zu Objekten oder Ereignissen bezüglich der Ausprägung eines Merkmals oder einer Eigenschaft, so dass bestimmte Relationen zwischen den Zahlen vorhandene Relationen zwischen den Objekten (oder Ereignissen) homomorph (gleichförmig) abbilden.
Welche Zuordnungsregeln und Relationen gibt es?
“gleich” und “ungleich”
“mehr” oder “größer als”
“doppelt so viel wie” ( Relationen bleiben auch erhalten bei Transformationen z.B Länge in cm vs. Länge in m)
Messung
Abbildung eines empirischen Relativs in ein numerisches Relativ, bei dem die Relationen zwischen den Messobjekten und den zugeordneten Zahlen erhalten bleiben (homomorphe Abbildung).
Skala
Numerisches Relativ, das aus der homomorphen Abbildung resultiert. Je nachdem, welche Relationen im empirischen Relativ gelten, unterscheidet man zwischen verschiedenen Skalenniveaus
Nominalskala
Ordinalskala
Intervallskala
Verhältnisskala
“nominal scale” oder “categorical scale”) ist die niedrigste Skalierung zur Messung von qualitativen Merkmalen. Mit ihr kann festgestellt werden, ob eine bestimmte Merkmalsausprägung (männlich/weiblich, ledig/verheiratet, blond/braun) vorhanden ist – oder eben nicht.
Beispiele:
Blutgruppe
Geschlecht
Nationalität
Augenfarbe
Parteizugehörigkeit
Zulässige Transformationen Nominalskala
Nominalskalierte Daten können quasi beliebig transformiert werden; einzige Voraussetzung ist, dass die unterschiedlichen Ausprägungen erhalten bleiben (Geschlecht numerisch mit {1,2,3} oder {7, 66, 99} kodieren ist egal).
Auf dem Nominalskalen werden verschiedenen qualitativen Merkmalsausprägungen beliebigen Zahlen zugeordnet, deren Ordnung und Größe arbiträr ist. Das wiederum schränkt mögliche Berechnungen ein – Mittelwerte z.B. machen keinen Sinn (z.B. Mittelwert Geschlecht = 0.67).
Der “durchschnittliche” Unfallverursacher
0 = männlich und weiß
1 = männlich und schwarz
2 = weiblich und weiß
3 = weiblich und schwarz
Ordinalskala (Rangskala)
Mit einer Ordinalskala oder „geordneten“ Skala können Sie die Haltung eines Befragten zu einem Thema anhand einer Reihe von Antworten mit einer Rangfolge bewerten. Die Antwortoptionen können beispielsweise lauten: „Sehr zufrieden“, „Zufrieden“, „Unzufrieden“ und „Sehr unzufrieden“.
Skalenniveau hängt nicht nur davon ab, welche Relationen zwischen den Messobjekten bestehen, sondern auch, welche Relationen durch die Messung tatsächlich abgebildet werden (z.B. Charakterisierung von Windstärken durch Erscheinungsbilder oder Bestimmung der Rangfolge beim Laufen durch beobachten, wer wann die Zielline überquert).
Direkte vs indirekte Rangfolge ( Ordinalskala )
Direkte Rangfolge (originäre Rangordnung) Untersuchungsobjekte werden anhand der Merkmalsausprägung in eine Rangordnung gebracht.
BewerberInnen für Job oder WG
Ordne die Handys / Urlaubsorte / Personen nach Präferenz, Attraktivität etc.
Rangfolge basierend auf Abfolge von Verhaltensweisen
Indirekte Rangordnung
Anstatt alle Objekte direkt in eine Rangfolge zu ordnen, kann eine indirekte Rangordnung durch paarweise Vergleiche der Objekte gebildet werden
Bewerber A oder B besser? A oder C? B oder D? etc.
Handy A präferiert über B? A über C? B oder D? etc.
Urlaubsort A oder B? A oder C? B oder D? etc.
Bei einer Intervallskala entsprechen die Abstände zwischen den Zahlen den Abständen der Merkmalsausprägung.
Beispiel:
Eine typische Intervallskala ist die Celsiusskala. Der Temperaturabstand zwischen 10 und 11 Grad Celsius ist genauso groß wie der Abstand zwischen 75 auf 76 Grad Celsius.
Zulässige Transformationen Intervallskala
Alle linearen Transformationen sind zulässig, d.h. Transformationen der Form y=a∙x+b
Beispiel: Umwandlung Celsius in Fahrenheit: 𝐹 = 1,8 ∙ 𝐶 + 32 5° C = 41° F vs. 10° C = 50° F vs. 15° C = 59° F: Differenz von 5°C entspricht immer
einer Differenz von 9° F
Messungen auf Intervallskalenniveau erlauben keine Aussage über Verhältnisse zwischen Messwerten, weil der Nullpunkt der Skala beliebig ist: 0°C bedeutet nicht, dass keine Temperatur vorhanden ist.
Ratingskala
eignet sich für mündliche oder schriftliche Aussagen wie etwa bei Online-Befragungen, um persönliche Einschätzungen der Befragten in Abstufungen festzuhalten. Die Testpersonen wählen dabei diejenige Stufe, die ihrem subjektiven Empfinden bezüglich des untersuchten Gegenstandes am ehesten entspricht. Dieser Skalentyp wird häufig in Einstellungs- oder Persönlichkeitsfragebögen eingesetzt.
Verhältnisskala (Ratioskala)
Eine Verhältnisskala bzw. Ratioskala („ratio scale“) ordnet den Objekten eines empirischenRelativs Zahlen zu, die so geartet sind, dass das Verhältnis zwischen je zwei Zahlen dem Verhältnis der Merkmalsausprägungen der jeweiligen Objekte entspricht. Die Verhältnisskala verfügt über einen absoluten Nullpunkt.
Eine Messung auf dem Verhältnisskalenniveau setzt nicht nur voraus, dass Unterschiede definiert sind, sondern auch dass es einen inhaltlich sinnvollen Nullpunkt gibt.
Qualitative Variablen
Endliche Anzahl von Ausprägungen
Höchstens ordinalskaliert
Kennzeichnen die Qualität, nicht das Ausmaß eines Merkmals
Quantitative Variablen
Ausprägungen stellen ein Ausmaß oder eine Intensität dar
Werte sind stets Zahlen
Metrische/Kardinalskalierte Variablen (Intervall-, Verhältnis, oder Absolutskala)
Gütekriterien quantitativer Methoden?
Objektivität
Reliabilität
Validität
Allgemeines Gütekriterium wissenschaftlicher Untersuchungen: Verschiedene Forscher:innen müssen unter den gleichen (Versuchs-) Bedingungen zu den gleichen Ergebnissen gelangen. Unabhängigkeit der Resultate von Versuchssituation und Versuchsleitern.
Zuverlässigkeit und Beständigkeit einer Untersuchung oder eines (Mess-)Instrumentes. Reliabel ist ein Instrument dann, wenn es bei einem relativ gleich bleibenden Verhalten gleiche oder ähnliche Ergebnisse liefert.
Test-Retest-Reliabilität
Paralleltest-Reliabilität
Interrater-Reliabilität
Die Test-Retest-Reliabilität (Stabilität) beschreibt das Ausmaß der Übereinstimmung bei einer wiederholten Anwendung der Instrumente (Methoden) bei der gleichen Stichprobe.
Die Paralleltest-Reliabilität (Stabilität) beschreibt das Ausmaß der Übereinstimmung zwischen zwei Tests (oder Testversionen), die das gleiche Messen (wollen).
Die Interrater-Reliabilität beschreibt das Ausmaß der Übereinstimmung (“Konkordanz”)unterschiedlicher Beobachter / Anwender (“Rater”). Um so ähnlicher die Urteile (Ratings) der Beobachter:innen, desto höher ist die Interrater-Reliabilität.
Interrater-Reliabililtät ist letztlich auch ein Maß der Objektivität!
Typische Einsatzmöglichkeiten:
Zwei Therapeut:innen diagnostizieren Depression bei 20 Patient:innen anhand von Symptomen
Zwei Erziehungswissenschaftler:innen bewerten 50 Kinder in Bezug auf ihre Lesefähigkeit
Zwei Psycholog:innen bewerten die Synchronizität der Kommunikation von Therapeut:innen und Patient:innen
Die Validität (Gültigkeit) beurteilt eine quantitative Untersuchung danach, ob sie auch gemessen
hat, was sie messen wollte.
Messen die Items eines Intelligenztestes tatsächlich die intellektuelle Leistungsfähigkeit oder eher die Konzentrationsfähigkeit einer Person?
Misst eine Klausurfrage adäquat den Wissenserwerb einer Studierenden?
Inhaltsvalidität
Die Items eines Tests sollen das Zielkonstrukt (z.B. Intelligenz, Lernerfolg) möglichst gut und vollständig abdecken (z.B. Klausur sollte sich auf Unterrichtstoff der Vorlesung beziehen).
Erfordert häufig Beurteilung durch Expert:innen und konzeptuelle Analysen von Zielkonstrukt und Test
Konstruktvalidität
Konstruktvalidierung als längerer Prozess, beim dem u.a. überprüft wird, welche und wie viele Hypothesen über das Merkmal sich durch Testwerte bestätigen lassen.
Test zu Aggressivität: höhere Werte bei jungen als bei alten Männern?
Test zu Depression: Höherer Werte für Patienten, die sich mit der Diagnose Depression in Behandlung befinden, als
bei anderen Menschen?
IQ-Test: Niedrigere Werte bei Schülern die Förderunterricht bekommen, als solche, die ihn nicht bekommen?
Testwerte sollten hoch mit ähnlichen Konstrukten/Tests korrelieren (konvergente Validität) und niedrig mit unähnlichen Konstrukten/Tests (divergente Validität)
Kriteriumsvalidität
Zur Beurteilung der Testvalidität wird ein ”Außenkriterium” herangezogen
z.B. Schulnoten oder Lehrerbeurteilung als Kriterium für einen schulischen Leistungstest
Je nachdem, wann das Außenkriterium gemessen wird, verschiedene Varianten der Kriteriumsvalidität.
-> Retrospektive Validität
-> Konkurrente Validität
->Prognostische Validität
->Inkrementelle Validität
Problem: Nicht immer ist ein Außenkriterium vorhanden – was ist z.B. ein Außenkriterium für die Persönlichkeits- eigenschaft “Neurotizismus”?
Last changeda year ago