Welche Skalenniveaus kennst du? Nenne Beispiele
Metrisch
Verhältnisskala = Definition der Abstände zwischen zwei Ausprägungen, Absoluter Nullpunkt.
Körpergröße, Alter
Intervallskala = wie Verhältnisskala, aber willkürliche Setzung des Nullpunktes
Intelligenzquotient, Zeitrechnung
Ordinalskala
Ranfgolge der Ausprägungen hinsichtlich ihrer Wertigkeit
Keine Definition der Abstände zwischen den Rängen
Podiumsplätze, Schulnoten
Nominalskala
Rein nominelle Unterschiede zwsichen den Ausprägungen
Keine unterschiedlichen Wertigkeiten zwischen den Ausprägungen
Blutgruppen, Geschlecht
Säulendiagramm/Balkendiagramm
Welches Skalenniveau?
Häufigkeiten von Merkmalsausprägungen
nominal, ordinal, metrisch
Histogramm
Häufigkeit von gruppierten Merkmalsausprägungen
metrisch
Boxplot
Visualisierung von Median, oberen und unterem Quartil, Minimum und Maximum, Ausreißer
ordinal, metrisch
Streudiagramm
Darstellung der Merkmalsausprägungen von zwei i.d.R. metrischen Merkmalen als Punkte
Minimum bzw. Maximum
Kleinste bzw. größte Merkmalsausprägung
Modus / Modalwert
Häufigste Merkmalsausprägung.
Median / Zentralwert
Merkmalsausprägung, die bei (aufsteigend) sortierten Beobachtungen in der Mitte liegt.
Arithmetischer Mittelwert
Summe aller Werte geteilt durch die Anzahl
Quantil
Das p-Quantil ist der Wert, für den gilt, dass er von p Prozent der Werte nicht überschritten wird.
Varianz
Maß für die durchschnittliche quadratische Abweichung zum Mittelwert
Diese hat aber eine andere Einheit als die Daten, z. B. Daten in €, Varianz €2. Durch das Quadrieren werden Abweichungen zum Mittelwert nach oben oder unten gleich behandelt und größere Abweichungen stärker gewichtet
Standardabweichung
Quadratwurzel der Varianz
Variationskoeffizient
erlaubt den Vergleich von Standardabweichungen, da er nicht von der Dimension abhängt, in der gemessen wird
Interquartilsabstand
Oberes Quartil (75%- Quantil) – unteres Quartil (25%-Quantil)
Spannweite
Maximum - Minimum
Favstats
Modalwert/Modus Formel
Überblick Verhältnisse
Pearson
Geeignet für Kardinal skalierte (metrische) Daten, setzt voraus, dass die Beziehung zwischen den Variablen linear ist
Ergebnisinterpretation:
Spanne der möglichen Werte: -1 bis 1
1: perfekte positive lineare Beziehung
0: keinerlei lineare Beziehung (Korrelation) zwischen den beiden Variablen erkennbar
-1: perfekte negative lineare Beziehung
Spearman
Geeignet für ordinal skalierte Daten. Beziehung zwischen den Variablen nicht linear
Überischt Inferenzverfahren
Untersuche, ob der Anteil der Ereignisse in einer Gruppe einem bestimmten Wert entspricht.
Beispielkomponenten:
Abhängige Variable (Y): Eine Eigenschaft, die in zwei Kategorien unterteilt werden kann (binär). Zum Beispiel: ob jemand eine bestimmte Handlung ausführt oder ein bestimmtes Merkmal hat (Ja/Nein).
Unabhängige Variable (X): Die Gruppe oder Kategorie, die untersucht wird. Zum Beispiel: Geschlecht, Alter, Studienrichtung.
Untersuche, ob sich die Anteile zweier Gruppen signifikant unterscheiden.
Unabhängige Variable (X): Eine kategorial-binäre Variable, die die Gruppen definiert. Zum Beispiel: Geschlecht (männlich/weiblich), Status (Student/kein Student).
Permutation:
Wenn H0 gilt, sollte es für den Wert der abhängigen Variable egal sein, welchen Wert die unabhängige hat. Beurteilt wird, ob der beobachtete Wert der Stichprobe unter den permutierten unwahrscheinlich ist.
Der p-wert ist hier der Anteil der simulierten Teststatistiken, die mindestens so groß sind wie der beobachtete Wert.
Untersuche, ob die Verteilung einer kategorialen Variable über die Kategorien einer anderen kategorialen Variable hinweg gleich ist.
Abhängige Variable (Y): Eine kategoriale Variable mit mehr als zwei Kategorien. Zum Beispiel: bevorzugte Lernmethode (Gruppenarbeit, Einzelstudium, Online-Kurse).
Unabhängige Variable (X): Eine andere kategoriale Variable mit mehr als zwei Kategorien. Zum Beispiel: Studiengang (Ingenieurwesen, Wirtschaft, Geisteswissenschaften).
Die Chi2-Teststatistik wird als normierte quadratische Abweichung der beobachteten von den erwarteten Häufigkeiten berechnet und ist unter H0 asymptotisch chi2-verteilt mit (k-1)*(m-1) Freiheitsgraden
Untersuche, ob der Mittelwert einer numerischen Variable einem bestimmten Wert entspricht.
Abhängige Variable (Y): Eine numerische Variable, die gemessen werden kann. Zum Beispiel: Anzahl der Stunden, die für das Lernen auf eine Klausur aufgewendet werden.
Unabhängige Variable (X): Eine kategorial-binäre Variable. Zum Beispiel: Geschlecht (männlich, weiblich).
Untersuche, ob sich die Mittelwerte einer numerischen Variable zwischen zwei Gruppen signifikant unterscheiden.
Abhängige Variable (Y): Eine numerische Variable, die gemessen werden kann. Zum Beispiel: Durchschnittliche Anzahl der Lernstunden pro Woche.
Unabhängige Variable (X): Eine kategorial-binäre Variable. Zum Beispiel: Raucherstatus (rauchend, nicht rauchend).
Untersuche, ob sich die Mittelwerte einer numerischen Variable über mehr als zwei Gruppen signifikant unterscheiden.
Abhängige Variable (Y): Eine numerische Variable, die gemessen werden kann. Zum Beispiel: Durchschnittliche Noten in einem Semester.
Unabhängige Variable (X): Eine kategoriale Variable mit mehr als zwei Gruppen. Zum Beispiel: Studienfach (Ingenieurwesen, BWL, Informatik, Psychologie).
Unterscheiden sich die durchschnittlichen Noten signifikant zwischen verschiedenen Studienfächern?
Nominale Daten in Faktoren umwandeln
Lineare Regression
Annahme: f ist eine lineare Funktion, d.h. f(x) = β0 + β1 * x
Β0 = Achsenabschnitt
Β1 = Steigung, d.h. Änderung des Mittelwerts von y, wenn x eine Einheit größer beobachtet wird
F(x) = die abhängige Variable
x = unabhängige Variable
Multiple Regression
Bei mehr als einer unabhängigen Variable und einer abhängigen Variable
Gleichung: y= β0 + β1 * x1 + β2 * x2+…… + βi * xi
Aus R wäre das: abhängige Variable = Estimate (Intercept) + Estimate (Var1)*Var1 + Estimate (Var 2)* Var2…
Die Variablen werden nur in die Gleichung aufgenommen, wenn P kleiner alpha --> Nur dann haben sie einen Einfluss
Je höher der Betrag des Estimate einer Variable, desto größer ihr Einfluss
Güte eines Modells:
R2 & F-Statistik
R2 (Bestimmtheitsmaß)gibt den Anteil der im Modell erklärten Variation von y an. Umso näher an 1, desto mehr kann die Streuung erklärt werden. Anteil der erklärten Varianz.
R2 adjustes: Güte maß bei multiplen Regression. Weil durch jede weitere Variable das normale R2 vergößert würde.
F-Statistik: Signifikanz des gesamten Modells. Wenn p kleiner alpha, dann wird H0 abgelehnt aka. Modell ist ungültig
—> An R2 und der F-Statistik erkennt man die Güte von einem Modell
Allgemeine Aussage des p-Werts
Der p-Wert ist die kleinstmögliche Irrtumswahrscheinlichkeit, bei der H0 gerade noch verworfen werden kann
Wissenschaftlicher Realismus vs. Konstruktivismus
Was ist es?
Unterschiede
Kritikpunkte
Folgen für die Forschung
WR: Kann zur Vernachlässigung alternativer Theorien und zur Stagnation in der Forschung führen, da weniger Raum für Veränderung bleibt
K: Schwierigkeiten bei der Verallgemeinerung von Erkenntnissen —> Reliabilität kann nicht eingefangen werden, da es schwierig ist, die objektive Wahrheit zu bestimmen
Methoden zur Datenerhebung
Datenerhebung
quantitative Methoden
qualitativemethoden
Beobachtung: direkte Erhebung von Gegebenheiten, die nicht auf Fragen und antworten beruhen
Experiment: kontrollierte Vorgehensweise, bei der eine oder mehrere unabhängige Variablen manipuliert werden, dass die Auswirkungen auf die abhängige Variable beobachtet werden können
Umfragen: z.B. in Form von standardisierten Fragebögen, schriftlich oder online an eine große Anzahl von Personen
Interview: Interview einer Person, mit offenen Fragen.
Beobachtung: Erfassung von Verhaltensweisen und Ereignissen in ihrem natürlichen Kontext.
Fokusgruppen: moderierte Befragung von mehreren Personen zur Erfassung vielfältiger Erfahrungen und Meinungen
Methoden können nach dem standardisierungsgrad klassifiziert werden
Induktion und Deduktion
Falsifikation
Schematische Darstellung des empirischen Forschungsprozesses
Gütekriterien (Anforderungen an Messungen)
Anforderungen an Messungen:
Validität: Wird gemessen, was gemessen werden soll?Kriterium für die Gültigkeit der Messung
Reliabilität: Führen wiederholte Messungen zu vergleichbaren Ergebnissen? Kriterium für die Genauigkeit/Zuverlässigkeit der Messung
Objektivität: Beeinflusst der Forscher die Messergebnisse? Kriterium für die Unabhängigkeit der Messung
Objektivität und Reliabilität sind notwendige, aber keine hinreichende Bedingung für Validität.
Qualitative vs. Quantitative Forschung
Deskriptivstatistik vs. Inferenzstatistik
Die deskriptive Statistik beschreibt und fasst Daten einer Stichprobe zusammen, ohne auf Verallgemeinerungen der Grundgesamtheit zu zielen
—> Deskriptiv = beschreibend
Die Inferenzstatistik befasst sich mit dem Ziehen von Schlussfolgerungen über eine Grundgesamtheit basierend auf den Daten einer Stichprobe
—> Ziel: von der Stichprobe auf allgemeinere Erkenntnisse über die Grundgesamtheit zu schließen
Punktschätzung
Punktschätzer variieren mit der Stichprobe. Der Standardfehler beschreibt die Streuung eines Schätzwertes, z.B. für das arith. Mittel. —> Es kommt immer etwas anderes heraus
Der Schätzwert wird in der Regel nie mit dem wahren Wert der Grundgesamtheit übereinstimmen
Konfidenzintervall
Konstruktion eines Bereichs von Werten, von dem wir denken, dass der gesuchte Parameter der GG hineinfällt
1-alpha = Wahrscheinlichkeit, dass das Konfidenzintervall den unbekannten Parameter überdeckt.
Alpha (Irrtumswahrscheinlichkeit) --> Wahrscheinlichkeit, dass KI den unbekannten Parameter nicht überdeckt
Je größer die Sicherheit (je kleiner alpha) desto breiter ist das Intervall
Hypothesentest
Vorgehen:
Inhaltliche Forschungsthese bestimmen
Nullhypothese H0 und Alternativhypothese H1 festlegen. Dazu passende Teststatistik bestimmen.
Verteilung der Teststatistik unter H0 bestimmen
Prüfung über p-Wert: ist der beobachtete Wert der Teststatistik der Stichprobe unter H0 (sehr) selten? p<alpha --> Nullhypothese verwerfen
H0 kann nicht verworfen werden: Abweichung nicht signifikant
H0 wird verworfen: Abweichung signifikant
p-Wert: gibt an, wie viele Stichproben ein mindestens so extremes Ergebnis haben, wie die beobachtete Stichprobe, wenn H0 gilt.
Nullhypothese H0
Alternativhypothese H1
Behauptet, dass kein Effekt/Unterschied/Zusammenhang besteht
Gegenhypothese --> es besteht ein Effekt/ Unterschied/ Zusammenhang
Varianzanalyse (ANOVA)
Vergleich des Lagemaßes, bei mehreren unabhängigen Mittelwerten. Ein- oder mehrfaktoriell möglich, bei mehr als einem Einfluss auch Wechselwirkungen
Voraussetzung: Daten innerhalb der K Stichproben /Gruppen unabhängig, identisch, normalverteilt
Nullhypothese: Lagemaß u für alle Gruppen gleich
Die Gesamtstreuung wird zerlegt in die Streuung zwischen den Stichproben und die Streuung innerhalb der Stichproben.
Ist das Verhältnis der Streuung zwischen den Gruppen im Verhältnis zur Streuung innerhalb der Gruppen groß, so ist dies unter H0 unwahrscheinlich
Alpha-Fehler Kummulierung: Die Irrtumswahrscheinlichkeiten würden sich bei aufeinander gereihten t-tests kumulieren.
Ein signifikantes Ergebnis bei der Varianzanalyse bedeutet nicht automatisch, dass sich die Mittelwerte paarweise signifikant unterscheiden, um dies zu prüfen, müssten t.tests für alle Paarungen durchgeführt werden.
Was ist eine Theorie?
Eine Theorie ist eine Menge von Aussagen über die Beziehung(en) zwischen zwei oder mehr Konzepten oder Konstrukten.
Qualitätskriterien einer wissenschaftlichen Theorie
Logische Korrektheit
Präzision
Originalität
Nützlichkeit
Fruchtbarkeit
Einfachheit
Falsifizierbarkeit
Hoher Allgemeinheitsgrad
Hoher Informationsgehalt
Hoher Bewährungsgrad
Hypothesen
Hypothesen sind Annahmen oder Vermutungen über Tatsachen oder Zusammenhänge, die noch nicht empirisch bewährt sind (sprich eine theoretisch begründete Prognose für ein bestimmtes empirisches Ergebnis).
Eine entsprechende Untersuchung wird dann zeigen, ob die Prognose eintrifft und sich das erwartete Ereignis tatsächlich zeigt und dadurch die Hypothese beibehalten werden kann
Beispiele für unabhängige Variable (x)
Unterrichtsform mit ≥ 2Ausprägungen
Studiengang mit ≥ 2 Ausprägungen
Prüfungszeitraum mit ≥ 2 Ausprägungen
Spielstandorte mit ≥ 2 Ausprägungen
Spielliga ≥ 2 Ausprägungen
Beispiele für numerische Variablen
Alter
Einkommen
Körpergröße
Gewicht
Notendurchschnitt
Anzahl der abgeschlossenen Kurse pro Semester
Studiendauer
Prüfungsergebnisse
Beispiele für abhängige Variable (y)
Punktzahl
Anzahl der Studierenden
Abschlussnote
Tore pro Spiel
Ballbesitz pro Prozent
Stärken und Schwächen Qualitative vs. Quantitative Methoden
Qualitative Methoden
Quantitative Methoden
Stärken
- Tiefe Einsicht/Verständnis durch detaillierte Beschreibungen
- Flexibilität & Anpassungsfähigkeit, um neue Erkenntnisse und unerwartete Ergebnisse zu berücksichtigen
- Vielfalt der Datenquellen, um ein umfassendes Abbild des Untersuchungsgegenstandes zu erhalten
- Ermöglicht Erforschung von Kontext und Prozessen, die schwer quantifizierbar sind
- Empfindsamkeit für soziale und kulturelle Kontexte, indem sie die Perspektiven der Teilnehmer*innen in den Mittelpunkt stellt
- Generalisierbarkeit durch große und repräsentative Stichprobe, wodurch die Ergebnisse auf eine größere Population verallgemeinert werden können
- Objektivität und Reliabilität
- Präzision und Klarheit
- Effizienz: können oft schneller und kostengünstiger durchgeführt werden, besonders bei großen Stichproben
- Möglichkeit zur Hypothesenprüfung (Identifikation der Ursache-Wirkungs-Beziehung)
Schwächen
- Geringe Generalisierbarkeit aufgrund des kleinen Stichpunkts und des fokussierten Untersuchungsansatzes
- Potenzielle Subjektivität, Interpretation der Daten hängt von den Forschern ab, kann zu subjektiven Einschätzungen & Bias führen
- Zeit- und Ressourcenintensiv, im Vergleich zu quantitativen Methoden
- Schwierigkeiten bei der Standardisierung, da der Fokus auf Einzigartigkeit und Kontextualität liegt
- Vernachlässigung des sozialen und kulturellen Kontextes, kann zu eingeschränktem Verständnis führen
- Eingeschränkte Flexibilität, Standardisierung lässt wenig Anpassung an neue oder unerwartete Erkenntnisse zu
- Oberflächlichkeit: Komplexität menschlicher Erfahrungen/Interaktionen können nicht vollständig erfasst werden
- Potenzial für Verzerrungen, schwierig alle relevanten Variablen zu kontrollieren
- Kleinere Stichproben können zu unzuverlässigen/nicht generalisierbaren Ergebnissen führen, was die Validität der Forschung beeinträchtigt
Last changed3 months ago