Kriterien für eine gute Theorie
- Überprüfbar
- Übersichtlich und leicht verständlich
- Vorhersagen und Erklärungen liefern
- Widerspruchsfrei sein
- Nicht auf einer Menge von Postulaten basieren
Aufgaben von Theorien:
- Deskriptionscharakter
- Erklärungswert
- Prognostischen Wert
- Formbar
- Gesetze und theorien werden per Induktion aus einer sachlichen Basis gewonnen (zB Beobachtung)
- System von Hypothesen
Kriterien von Hypothesen:
Empirisch prüfbar, Aussage muss empirisch überprüfbar sein; Begriffe müssen beobachtbaren Daten zugeordnet werden (zB die Hölle ist heißer als 220 Grad)
Gewisser Anspruch auf Allgemeingültigkeit, Über den Einzelfall hinausgehende Behauptung (nicht peter hat morgen Kopfschmerzen vom trinken. Stattdessen: die menge an konsumiertem Alkohol steht in positivem Zusammenhang zu Kopfschmerzen
Formalstruktur eines Konditionalsatzes: „Wenn-Dann“ „je-Desto“
Theoretische Begründung: Geltung und Relevanz kann mit wissenschaftlichen Theorien begründet werden
Widerlegbarkeit (Falsifizierbarkeit)
Wozu Hypothesen?
Fokus für die Forschung
Theoretische Erwartung wird überprüft
Diese können dann vorläufig bestätigt werden oder widerlegt/falsifiziert
Ohne Hypothese kann jedes Ergebnis im Nachhinein als erwartet interpretiert werden (Post hoc-Rationalisierung)
Sie kennen verschiedene Arten von Stichproben sowie die Stichprobenproblematik
· Vollerhebung: Erhebung von Daten der gesamten Population
· Teilerhebung (Stichprobe): Repräsentationsschluss
· Einzelfall
Arten von Stichproben:
Einfache Zufallsstichprobe (Simple Random Sample)
Jedes Element der Grundgesamtheit kann mit gleicher Wahrscheinlichkeit gewählt werden
Geschichtete (Stratifizierte) Zufallsstichprobe
Verteilung der Merkmale in der Population müssen bekannt sein
Aus den Segmenten wird dann eine Zufallssp gebildet
Klumpenstichprobe
Elemente können in der GG nicht erfasst werden, es liegen aber Informationen vor wo die Elemente gefunden werden können. Bestehende Klumpen von Elemente untersucht
Ad-hoc Stichprobe/Gelegenheitsstichprobe
Es werden die ersten verfügbaren Personen für eine Untersuchung genommen
Stichprobenproblematik:
Qualitätsprüfung der SP:
Repräsentativ: Je größer desto gut
Ausschöpfung: je mehr Ausfälle desto schlechter
Repräsentativ hinsichtlich der Merkmale des Gebiets
Sie können definieren, was „messen“ ist
Überführen eines „empirischen Relativs“ in ein „numerisches Relativ“
zB wie häufig lügen sie? Von 1-5 = numerisches Relativ
Zuordnung von Objekten zu Zahlen
Ziel: Quantifizierung der zu untersuchenden Merkmale
Mindestens erhalt einer homomoprhen Abbildung (=strukturerhaltende Abbildung)
Homomorphe Abbildung:
Elemente einer Menge werden so in einer anderen Menge abgebildet, dass bestimmte Strukturmerkmale der Urbilder erhalten bleiben
Sie wissen, was mit Operationalisierung gemeint ist.
Die Übersetzung theoretischer Begriffe in messbare Größten (Indikatoren) ist Operationalisierung
Konstrukt: nicht unmittelbar fassbarer Begriff – bezieht sich auf etwas nicht direkt Beobachtbares (latent zB)
Indikator (manifest) Anzeiger für Sachverhalte
Können direkt beobachtbar oder gemessen werden
Weisen auf Sachverhalte hin, die nicht direkt beobachtbar sind
zB Items in einem Fragebogen
Fazit: Das Verknüpfen des theoretischen Konzepts mit Messung stellt das Kernstück der Operationalisierung in der quantitativen Forschung dar
Sie kennen den Unterschied zwischen manifesten und latenten Variablen.
Eigenschaften von Variablen:
Merkmale = Variable
Variable Geschlecht; Merkmalausprägung: männlich, weiblich, divers
Zeitlich stabil 7 veränderlich?
Stabil – geschlecht
Veränderlich Motivation im Verlauf einer Schulstunde
Art der Merkmalausprägung
Stetige Variablen mit unendlich vielen Ausprägungen (zB länge, Zeit)
Diskrete Variable mit endlichen Ausprägungen (zB Geschwisterzahl)
Binäre/dichotome Varliablen (zwei Abstufungen)
Polytome Variable (mehrfach abgestuft)
! Manifeste Variablen: direkt beobachtbar (Augenfarbe) Indikator, um latent zu messen;
Latente Variable nicht beobachtbar (Angst) - Konstrukt!
Nominalskala
Unterscheidung: gleich, ungleich
Unterschiedlichkeit der Objekte
Empirische Deutung der Relation zwischen den Ziffern /Rangordnung oder Abstände) nicht zulässig
Geschlecht, Farbe, Parteizugehörigkeit, Augenfarbe, Haarfarbe…
Ziel: Unterscheidung (von Personen) zB Urs hat das selbe Geschlecht wie Hans
Messen: empirisches Relativ + numerisches Relativ. Strukturerhaltende/homomorphe Abbildung
Zulässige Transformation: 1= weiblich; danach 2= weiblich. Zahlen haben keinerlei empirische Bedeutung. Personen die gleiche Werte haben müssen nach trans. Immernoch gleiche werte haben;
2 Kategorien = dichotom/binär -> 1=ja 2=nein
Ordinalskala
besser, stärker oder mehr
Gleichheit/Ungleichheit, Rangordnung einschätzbar
Keine empirische Deutung der Relation zwischen den zahlen
zB Schuldbildung, Rankings, Alter
Zahlen in Reihenfolge haben empirische Bedeutung: 1 größer als 2…
Genauer Abstand ist nicht erkennbar
Ziel: Klassifikation und Ordnung
Beispiel: „Ich komme oft erst nach Tagen dazu, Dinge zu tun, die ich eigentlich sofort erledigen wollte.“
• Für Hans stimmt die Aussage „mehr“ als für Anna und Frida.
• Für Anna stimmt die Aussage „mehr“ als für Urs
Zulässige Transformation: personen mit gleichen werten haben danach immernoch gleich, personen mit höher haben danach immernoch höher
Intervallskala
Ordinalskala + Differenzen der Merkmalausprägung haben Bedeutung
Verhältnisse der Zahlendifferenzen entsprechen Verhältnis von Merkmalsunterschied
zB IQ, Persönlichkeitsmerkmale (gewicht, größe)
Differenz zwischen Variablen bekommt empirische Bedeutung
Verhältnisskala
Aussage über empirische Verhältnisse der zugehörigen Objekte möglich
Aussage über: Äquivalenz, Ordnung, Größe der verschiedenheit und Verhältnis von Merkmalsausprägungen
Natürlicher Anfangspunkt (null)
zB alter, Geschwindigkeit, Distanz i m
Sie können speed- und Powertests unterscheiden
Speedtests: Erfasung Geschwindigkeit bei der Problemlösung, leicte bis mittelschwere Aufgaben – aber Zeitbegrenzung!
Zeitdruck: unmöglich alle Aufgaben zu bearbeiten
Testergebnis: Anzahl der bearbeiteten Aufgaben (Tempowert)
Fehler in separatem Kennwert berücksichtigen und mit tempowert verrechnen
Powertest: erfassung des Kompetenzniveaus, aufgaben aller Schwierigkeitsgrade (aufsteigend) theoretisch: keine Zeitbegrenzung!
Aufgaben steigen im Schwierigkeitswert
Großzügige Zeitbegrenzung
Ermittlung maximalen Fähigkeitsniveaus (Power)
Zeitbegrenzte Intelligenztests messen nicht nur Intelligenz sondern auch speed komponente
Validität
Misst der Test das zu messende Merkmal?
Inhaltsvalidität: Items spiegeln theoretische Annahmen über das Konstrukt wieder
Konstruktvalidität: Messung erfasst das, was sie erfassen soll
Kriteriumsvalidität: Messung kann auf das Verhalten der Testperson in einem Außenkriterium geschlossen werden
Reliabilität
Grad der Messgenauigkeit (Präzision)
Interne Konsistenz = durchschnittliche Interkorrelation der Items einer Skala
Maße für interne Konsistenz = durchschnittliche Interkorrelation der Items einer Skala – Maße: Cronbachs Alpha, McDonalds Omega
Reliabilitätskoeffizienten: 0-1 (0= keine reliabilität, 1= perfekte)
Ab 0.6 – 0.7 akzeptabel reliabel
Einzelfalldiagnose strenger: größer als 0.8
· Test-Retest-Reliabilität: Wiederholte Messung der gleichen SP mit gleichem Instrument sollte gleiches Ergebnis haben (ohne Übungseffekt)
· Paralleltest-Reliabilität: Messung gleiche SP mit zwei unterschiedlichen Instrumenten, die das gleiche messen sollen
· Split-half-Reliabilität: Test nachträglich in zwei Hälften aufgeteilt, Übereinstimmung betrachtet
Objektivität
· Durchführungsobjektivität: keinen Einfluss auf das Ergebnis
· Auswertungsobjektivität: unabhängig von der auswertenden Person
· Interpretationsobjektivität: verschiedene Testanwender kommen zur selben Schlussfolgerung
· Durchführungsobjektivität: Durchführung darf keinen Einfluss auf das Ergebnis haben Bsp.: es muss egal sein welche LK die Schulaufgabe beaufsichtigt Wie unabhängig sind die Ergebnisse vom Testanwender?
Sie können mögliche Maßnahmen zur Herstellung von Objektivität im Kontext von schulischer Leistungsmessung ableiten
Auswertungsobjektivität:
Beispiel: Es muss egal sein, welche Lehrkraft die Schulaufgabe korrigiert. Schulische Leistungsbeurteilungen schneiden immer wieder unbefriedigend ab. Fehler werden bei guten Schüler*innen häufiger übersehen als bei leistungsschwächeren Schüler*innen
Interpretationsobjektivität:
Beispiel: Es muss egal sein, welche Lehrkraft die Noten vergibt. Interpretation hängt üblicherweise stark von den individuellen Urteilen der Lehrkräfte ab. Schülersicht: streng/nicht so streng à Wechsel der Lehrkräfte kann bei unveränderter Leistung zu Notensprüngen führen
Geschlossene Aufgaben
Vor- und Nachteile hat das?
Ökonomische Auswertung
Objektivität leicht herstellbar
Nachteile: Meist nur Wiedererkennen von Wissensinhalt, Ratemöglichkeit – abhängig von der Anzahl und Qualität der Distraktoren
Offenes Aufgabenformat
Vorteil:
Teilnehmer können sich verbalisieren
Kein Zwang durch Antwortkategorien
Wissens- und Meinungsabfrage
Kaum Rate-Effekt
Ggf. Hemmungen -> Fehlen antworten/Motivation?
Ungeeignet für Personen mit Schwierigkeiten beim Verbalisieren
Lesbarkeit der Handschrift
Zeitaufwendige Befragung -> wenig ökonomisch
Auswertungsmanuale nötig um Objektivität herzustellen
Systematische Kategorisierung
Beurteiler- Übereinstimmung
Mischformen
Fragen haben vorgegebene Antwortkategorien + eine zusätzliche offene Kategorie
Empfehlenswert v.a. bei komplexen Konstrukten, um Antwortalternativen nicht zu übersehen
negative Antworttendenzen
Absichtliche Verstellung: Übernahme von verschiedenen Rollen
Soziale Erwünschtheit: „richtige“ antwort geben
Akquieszenz: Bereitschaft der Personen die Frage mit „ja“ oder „stimmt“ zu antworten
Bevorzugen von extremen, unbestimmten oder besonders platzierten Antworten
Wahl von Antwortmöglichkeiten mit bestimmter Länge, Wortfolge oder seriale Position
Verfälschung wegen raten oder rasche Bearbeitung
Gegenmittel
Tendenz zur Mitte – gerade Anzahl von Antworten
Prozessdaten der Umfrage auswerten – wie lange wurde geabreitet?
Kontrollfragen einfügen
Fragen in ähnlicher Formulierung mehrfach stellen
Vertauschen der Reihenfolge von Antwortmöglichkeiten
Auswahl von Bildern
Forschungsdesign
Experimentelle Untersuchungen: Experiment, Quasi-Experiment
Nicht experimentell: Querschnittstudie, Längsschnittstudie
Das Experiment:
UV wird systematisch manipuliert
AV wird gemessen/beobachtet
Versuchungsbedingungen können wiederholbar hergestellt werden
Störvariablen werden ausgeschaltet bzw. kontrolliert zB durch randomisierung
Ziele: Aussage über kausalen Effekt einer UV auf AV
Bedingungen für kausale Zusammenhänge
Eindeutige Richtung (zB Zeitliche Abfolge) UV wird manipuliert, Effekt wird danach auf AV gemessen
Variablen hängen zusammen – Veränderung UV (statistisch) mit Veränderung AV einhergeht (Korrelation)
Plausible Alternativerklärungen werden ausgeschlossen- Kontrollmechanismen (Randomisierung) um Einfluss UV vom Einfluss von Störvariablen auf die AV zu trennen
Desto mehr plausible Alternativerklärungen ausgeschlossen werden können umso berechtigert sind kausale Schlussfolgerungen (hohe interne Validität)
Das Quasi-Experiment
Experimente ohne randomisierte Zuweisung nennt man Quasi-Experiment
Zufällige Zuweisungen oft nicht oder schwer möglich
Wegen Gefahr von Selektionseffekt ist die Kontrolle von Störvariablen oft schwer
Prä-Post
Voher-Nachher- Design
Unteschiede im Prä- Posttest pro Person können untersucht werden
Survey-, Korrelations-, Querschnittstudien
Warum nicht nur Experimente?
Viele Untersuchungen erlauben keine Manipulation des Treatments, bzw keine randomisierung
Stichprobe wird einmalig zu mehreren Variablen untersucht – Querschnittstudie
Querschnittstudie
Ein Messzeitpunkt (Untersuchungszeitraum)
Stichprobe von Personen
Zu denselben Variablen
zB Pisa
Merkmale einer Population erfassen
Zusammenhänge zwischen Variablen feststellen und ggf statistische Vorhersagen treffen
Unterscheidet sich der Bildungserfolg von Abhängigkeit vom Geschlecht (Gruppenunterschiede)
Wir stark hängt der sozioökonomische Status des Elternhauses mit dem Bildungserfolg zuasmmen? (Korrelation)
Für Kausalen zusammenhang: erfüllt nur Variablen hängen zusammen
Längsschnittstudie
Dieselben (oder vergleichbare) Personen
idR mindestens drei Messzeitpunkte
zu denselben Variablen mit identischen Erhebungsinstrumenten
Beschreibung von Entwicklung
Wie entwickelt sich ein Merkmal, Welche Form hat der Verlauf,
Aussage über Entwicklungen treffen: wie viel höher/niedriger ist die Ausprägung t1-t2
Hinweise auf Einflussfaktoren für die Entwicklung finden
Vorteil: kausaler zusammenhang durch: eindeutige Richtung, Variablen hängen zusammen
Lokalisationsmaße
Modus/Modalwert: der am häufigsten vorkommende Wert in der Verteilung
Median: Mittlerer Wert der Verteilung
Mittelwert, Arithmetisches Mittel = durchschnitt -> nur sinnvoll bei eingipfliger verteilung und möglichst symmetrisch
Nominal – Modus
Ordinal – Median
Metrisch – Mittelwert
Dispersionsmaße
Geben Auskunft über die Variation
Range/Spannweite/Variationsbreite:
Bereich der Messwerte
Differenz aus dem größten und kleinsten wert
Varianz
Unterschiedlichkeit der Personen in einem Merkmal in Relation zu einem Fixpunkt
Streuung der quadrierten Mittelwertsdifferenzen
Varianz desto größer desto stärker die Werte von ihrem Mittelwert abweichen
Standardabweichung:
Reale Streubreite/Streuung, die ein erhobenes Merkmal innerhalb der Stichrpobe aufweist
= Quadratwurzel der Varianz
Mit der Standardabweichung wird die Streuung innerhalb einer einzelnen Stichprobe gemessen
Wie viele einzelne Datenpunkte im Durchschnitt von ihrem Mittelwert entfernt sind
Berechnung Varianz:
Zentrale Tendenz, Streuung
Lösungen 1
Lösungen 2
Standardisierung von Daten
Normwerte des jeweiligen Tests (M&SD) benötigt
Korrelationskoeffizient
Maß der stärke eines statstischen Zusammenhangs zwischen zwei Variablen
R= -1 bis 1
Lineare Korrelation bsp.: Wirkung sonne auf die Wahrscheinlichkeit einer Person hautkrebs zu bekommen
Berechnung Korrelation nach Bravais und Pearson
Kovarianz = durchschnittliche Abweichungsprodukt aller Messwertpaare von ihrem jeweiligen Mittelwert
Positiv: gehen in die selbe richtung von Mittelwert weg zB Konzentration und Erinnerung
Negativ: positive Abweichung auf der einen Variable und eine negative Abweichung der anderen einhergeht zB Angst und Selbstsicherheit
Kein zusammenhang: Abweichung mal gleich und mal entgegengesetzt ist zB Schuhgröße und Extraversion
Korrelationstechniken
Produkt-moment Korrelation: inervallskalierte Variablen
Punktbiseriale Korrelation: eine Variable intervall- und eine nominalskaliert
Rangkorrelation: Variablen ordinalskaliert (Rangkorrelation nach Spearman) ebenfalls möglich bei intervall- und ordinalskalierten Variablen
Boxplot
Sinnvoll bei metrischen Variablen
IQR Berechnen: oQU – u Qu; Ausreiser: Minimum & Maximum prüfen
IQR x 1,5 -> abstand von Minimum zu uQU größer? Dann ausreiser
Sie kennen die Grundidee der Inferenzstatistik und den Ablauf des Hypothesentestens.
Grundidee: Hypothesen testen
Rückschlüsse von der Stichprobe auf eine Population
Aussagen Inferenzstatistik sind immer mit einem gewissen berechenbaren Grad der Unsicherheit behaftet
-> nur Wahrscheinlichkeitsaussagen ob zB zusammenhänge der Variablen auf die Population übertragen werden können
Signifikanzniveau
p= kleiner als der Festgelegte Fehlerwahrscheinlichkeit -> H0 abgelehnt
p= größer -> H0 beibehalten
Merkmale Normalverteilung
Merkmale: unimodal, eingipflige Verteilung,
Glockenförmig
Symmetrisch und nähert sich der x-achse asymptotisch an
Modus, Median, arithmetisches Mittel sind identisch
Die meisten Werte befinden sich daher in der Nähe des Mittelwertes, Je weiter man sich entfernt desto weniger Fälle treten auf. 95% der normalverteilten Werte liegen innerhalb von -2 bis +2
Standardabweichung gibt die Breite der Verteilung vor
Große SD = flache Kurve, kleine SD höhe Kurve
Cohen´s d
Zweiseitig vs einseitiges p
Zweiseitigen Hypothese: nur: entscheiden sich die Werte? – ungerichtete Hypothese
Einseitiger Test: gerichtete Hypothese – es ist von interesse ob eine Gruppe höher oder niedriger ist
Wenn das einseitige p bestätigt ist -> die gerichtete hypothese ist dann trotzdem signifikant, da die Daten den Unterschied in eine Richtung bestätigen, sonst aber nicht
Alpha Fehler
ANOVA
Mittelwertsunterschied zwischen mehr als 2 Gruppen getestet
Voraussetzung: mind. Intervallskalierte AV
Nach Anzahl der UVS unterscheidet man ein- und mehr faktorielle ANOVA
Mit ANOVA wird H0 getestet, dass KEIN unterschied zwischen den Mittelwerten der untersuchten Bedingungen besteht
Wird das Ergebnis der ANOVA signifikant – mindestens ein Gruppenmittelwert (oder mehrere) unterscheiden sich
Bonfenori-Korrektur
Wenn man mehrere Signifikanztests hintereinander durchführt steigt die Wahscheinlichkeit H1 anzunehmen, obwohl die Population h0 gilt
Alphaniveau jedes einzelnen Tests wird so verringert, dass sich trotz Alphafehlerinflation insgesamt nur eine Fehlerwahscheinlichkeit von 5% ergibt
Regressionsanalyse
Einfache lineare Regression
Vorhersagen AV durch EINE andere Variable UV
Einfluss *eines* Prädiktors auf Kriteriumsvariable
Fragestellung: Kann der IQ (Prädiktor) den Berufserfolg (Kriterium) vorhersagen?
Einfache VS multiple Regression
Multiple lineare Regression
Mehrere Prädiktoren
Fragestellungen: Können IQ und Bildungsgrad (Prädiktoren) den Berufserfolg (Kriterium) vorhersagen?
Last changed2 years ago