undefined

Buffl

Entscheidung

by Johanna O.

Welche Skalenniveaus kennst du? Nenne Beispiele

Metrisch

Verhältnisskala = Definition der Abstände zwischen zwei Ausprägungen, Absoluter Nullpunkt.
- Körpergröße, Alter
Intervallskala = wie Verhältnisskala, aber willkürliche Setzung des Nullpunktes
- Intelligenzquotient, Zeitrechnung

Ordinalskala

Ranfgolge der Ausprägungen hinsichtlich ihrer Wertigkeit
Keine Definition der Abstände zwischen den Rängen
- Podiumsplätze, Schulnoten

Nominalskala

Rein nominelle Unterschiede zwsichen den Ausprägungen
Keine unterschiedlichen Wertigkeiten zwischen den Ausprägungen
- Blutgruppen, Geschlecht

Säulendiagramm/Balkendiagramm

Welches Skalenniveau?

Häufigkeiten von Merkmalsausprägungen

nominal, ordinal, metrisch

Histogramm

Welches Skalenniveau?

Häufigkeit von gruppierten Merkmalsausprägungen

metrisch

Boxplot

Welches Skalenniveau?

Visualisierung von Median, oberen und unterem Quartil, Minimum und Maximum, Ausreißer

ordinal, metrisch

Streudiagramm

Welches Skalenniveau?

Darstellung der Merkmalsausprägungen von zwei i.d.R. metrischen Merkmalen als Punkte

Minimum bzw. Maximum

Kleinste bzw. größte Merkmalsausprägung

Modus / Modalwert

Häufigste Merkmalsausprägung.

Median / Zentralwert

Merkmalsausprägung, die bei (aufsteigend) sortierten Beobachtungen in der Mitte liegt.

Arithmetischer Mittelwert

Summe aller Werte geteilt durch die Anzahl

Quantil

Das p-Quantil ist der Wert, für den gilt, dass er von p Prozent der Werte nicht überschritten wird.

Varianz

Maß für die durchschnittliche quadratische Abweichung zum Mittelwert
Diese hat aber eine andere Einheit als die Daten, z. B. Daten in €, Varianz €2. Durch das Quadrieren werden Abweichungen zum Mittelwert nach oben oder unten gleich behandelt und größere Abweichungen stärker gewichtet

Standardabweichung

Quadratwurzel der Varianz

Variationskoeffizient

erlaubt den Vergleich von Standardabweichungen, da er nicht von der Dimension abhängt, in der gemessen wird

Interquartilsabstand

Oberes Quartil (75%- Quantil) – unteres Quartil (25%-Quantil)

Spannweite

Maximum - Minimum

Favstats

Modalwert/Modus Formel

Überblick Verhältnisse

Pearson

Geeignet für Kardinal skalierte (metrische) Daten, setzt voraus, dass die Beziehung zwischen den Variablen linear ist

Ergebnisinterpretation:

Spanne der möglichen Werte: -1 bis 1

1: perfekte positive lineare Beziehung
0: keinerlei lineare Beziehung (Korrelation) zwischen den beiden Variablen erkennbar
-1: perfekte negative lineare Beziehung

Spearman

Geeignet für ordinal skalierte Daten. Beziehung zwischen den Variablen nicht linear

Überischt Inferenzverfahren

Untersuche, ob der Anteil der Ereignisse in einer Gruppe einem bestimmten Wert entspricht.

Beispielkomponenten:

Abhängige Variable (Y): Eine Eigenschaft, die in zwei Kategorien unterteilt werden kann (binär). Zum Beispiel: ob jemand eine bestimmte Handlung ausführt oder ein bestimmtes Merkmal hat (Ja/Nein).
Unabhängige Variable (X): Die Gruppe oder Kategorie, die untersucht wird. Zum Beispiel: Geschlecht, Alter, Studienrichtung.

Untersuche, ob sich die Anteile zweier Gruppen signifikant unterscheiden.

Beispielkomponenten:

Abhängige Variable (Y): Eine Eigenschaft, die in zwei Kategorien unterteilt werden kann (binär). Zum Beispiel: ob jemand eine bestimmte Handlung ausführt oder ein bestimmtes Merkmal hat (Ja/Nein).
Unabhängige Variable (X): Eine kategorial-binäre Variable, die die Gruppen definiert. Zum Beispiel: Geschlecht (männlich/weiblich), Status (Student/kein Student).

Permutation:

Wenn H0 gilt, sollte es für den Wert der abhängigen Variable egal sein, welchen Wert die unabhängige hat. Beurteilt wird, ob der beobachtete Wert der Stichprobe unter den permutierten unwahrscheinlich ist.

Der p-wert ist hier der Anteil der simulierten Teststatistiken, die mindestens so groß sind wie der beobachtete Wert.

Untersuche, ob die Verteilung einer kategorialen Variable über die Kategorien einer anderen kategorialen Variable hinweg gleich ist.

Beispielkomponenten:

Abhängige Variable (Y): Eine kategoriale Variable mit mehr als zwei Kategorien. Zum Beispiel: bevorzugte Lernmethode (Gruppenarbeit, Einzelstudium, Online-Kurse).
Unabhängige Variable (X): Eine andere kategoriale Variable mit mehr als zwei Kategorien. Zum Beispiel: Studiengang (Ingenieurwesen, Wirtschaft, Geisteswissenschaften).

Die Chi2-Teststatistik wird als normierte quadratische Abweichung der beobachteten von den erwarteten Häufigkeiten berechnet und ist unter H0 asymptotisch chi2-verteilt mit (k-1)*(m-1) Freiheitsgraden

Untersuche, ob der Mittelwert einer numerischen Variable einem bestimmten Wert entspricht.

Beispielkomponenten:

Abhängige Variable (Y): Eine numerische Variable, die gemessen werden kann. Zum Beispiel: Anzahl der Stunden, die für das Lernen auf eine Klausur aufgewendet werden.
Unabhängige Variable (X): Eine kategorial-binäre Variable. Zum Beispiel: Geschlecht (männlich, weiblich).

Untersuche, ob sich die Mittelwerte einer numerischen Variable zwischen zwei Gruppen signifikant unterscheiden.

Beispielkomponenten:

Abhängige Variable (Y): Eine numerische Variable, die gemessen werden kann. Zum Beispiel: Durchschnittliche Anzahl der Lernstunden pro Woche.
Unabhängige Variable (X): Eine kategorial-binäre Variable. Zum Beispiel: Raucherstatus (rauchend, nicht rauchend).

Untersuche, ob sich die Mittelwerte einer numerischen Variable über mehr als zwei Gruppen signifikant unterscheiden.

Beispielkomponenten:

Abhängige Variable (Y): Eine numerische Variable, die gemessen werden kann. Zum Beispiel: Durchschnittliche Noten in einem Semester.
Unabhängige Variable (X): Eine kategoriale Variable mit mehr als zwei Gruppen. Zum Beispiel: Studienfach (Ingenieurwesen, BWL, Informatik, Psychologie).

Unterscheiden sich die durchschnittlichen Noten signifikant zwischen verschiedenen Studienfächern?

Nominale Daten in Faktoren umwandeln

Lineare Regression

Annahme: f ist eine lineare Funktion, d.h. f(x) = β0 + β1 * x

Β0 = Achsenabschnitt
Β1 = Steigung, d.h. Änderung des Mittelwerts von y, wenn x eine Einheit größer beobachtet wird
F(x) = die abhängige Variable
x = unabhängige Variable

Multiple Regression

Bei mehr als einer unabhängigen Variable und einer abhängigen Variable
Gleichung: y= β0 + β1 * x1 + β2 * x2+…… + βi * xi

Aus R wäre das: abhängige Variable = Estimate (Intercept) + Estimate (Var1)*Var1 + Estimate (Var 2)* Var2…

Die Variablen werden nur in die Gleichung aufgenommen, wenn P kleiner alpha --> Nur dann haben sie einen Einfluss

Je höher der Betrag des Estimate einer Variable, desto größer ihr Einfluss

Güte eines Modells:

R2 & F-Statistik

R2 (Bestimmtheitsmaß)gibt den Anteil der im Modell erklärten Variation von y an. Umso näher an 1, desto mehr kann die Streuung erklärt werden. Anteil der erklärten Varianz.

R2 adjustes: Güte maß bei multiplen Regression. Weil durch jede weitere Variable das normale R2 vergößert würde.

F-Statistik: Signifikanz des gesamten Modells. Wenn p kleiner alpha, dann wird H0 abgelehnt aka. Modell ist ungültig

—> An R2 und der F-Statistik erkennt man die Güte von einem Modell

Allgemeine Aussage des p-Werts

Der p-Wert ist die kleinstmögliche Irrtumswahrscheinlichkeit, bei der H0 gerade noch verworfen werden kann

Wissenschaftlicher Realismus vs. Konstruktivismus

Was ist es?

Unterschiede

Kritikpunkte

Folgen für die Forschung

WR: Kann zur Vernachlässigung alternativer Theorien und zur Stagnation in der Forschung führen, da weniger Raum für Veränderung bleibt
K: Schwierigkeiten bei der Verallgemeinerung von Erkenntnissen —> Reliabilität kann nicht eingefangen werden, da es schwierig ist, die objektive Wahrheit zu bestimmen

Methoden zur Datenerhebung

Datenerhebung

quantitative Methoden

qualitativemethoden

Beobachtung: direkte Erhebung von Gegebenheiten, die nicht auf Fragen und antworten beruhen

Experiment: kontrollierte Vorgehensweise, bei der eine oder mehrere unabhängige Variablen manipuliert werden, dass die Auswirkungen auf die abhängige Variable beobachtet werden können
Umfragen: z.B. in Form von standardisierten Fragebögen, schriftlich oder online an eine große Anzahl von Personen

Interview: Interview einer Person, mit offenen Fragen.
Beobachtung: Erfassung von Verhaltensweisen und Ereignissen in ihrem natürlichen Kontext.
Fokusgruppen: moderierte Befragung von mehreren Personen zur Erfassung vielfältiger Erfahrungen und Meinungen

Methoden können nach dem standardisierungsgrad klassifiziert werden

Induktion und Deduktion

Falsifikation

Schematische Darstellung des empirischen Forschungsprozesses

Gütekriterien (Anforderungen an Messungen)

Anforderungen an Messungen:

Validität: Wird gemessen, was gemessen werden soll?Kriterium für die Gültigkeit der Messung
Reliabilität: Führen wiederholte Messungen zu vergleichbaren Ergebnissen? Kriterium für die Genauigkeit/Zuverlässigkeit der Messung
Objektivität: Beeinflusst der Forscher die Messergebnisse? Kriterium für die Unabhängigkeit der Messung

Objektivität und Reliabilität sind notwendige, aber keine hinreichende Bedingung für Validität.

Qualitative vs. Quantitative Forschung

Deskriptivstatistik vs. Inferenzstatistik

Die deskriptive Statistik beschreibt und fasst Daten einer Stichprobe zusammen, ohne auf Verallgemeinerungen der Grundgesamtheit zu zielen

—> Deskriptiv = beschreibend
Die Inferenzstatistik befasst sich mit dem Ziehen von Schlussfolgerungen über eine Grundgesamtheit basierend auf den Daten einer Stichprobe
—> Ziel: von der Stichprobe auf allgemeinere Erkenntnisse über die Grundgesamtheit zu schließen

Punktschätzung

Punktschätzer variieren mit der Stichprobe. Der Standardfehler beschreibt die Streuung eines Schätzwertes, z.B. für das arith. Mittel. —> Es kommt immer etwas anderes heraus
Der Schätzwert wird in der Regel nie mit dem wahren Wert der Grundgesamtheit übereinstimmen

Konfidenzintervall

Konstruktion eines Bereichs von Werten, von dem wir denken, dass der gesuchte Parameter der GG hineinfällt
1-alpha = Wahrscheinlichkeit, dass das Konfidenzintervall den unbekannten Parameter überdeckt.
Alpha (Irrtumswahrscheinlichkeit) --> Wahrscheinlichkeit, dass KI den unbekannten Parameter nicht überdeckt
Je größer die Sicherheit (je kleiner alpha) desto breiter ist das Intervall

Hypothesentest

Vorgehen:

Inhaltliche Forschungsthese bestimmen
Nullhypothese H0 und Alternativhypothese H1 festlegen. Dazu passende Teststatistik bestimmen.
Verteilung der Teststatistik unter H0 bestimmen
Prüfung über p-Wert: ist der beobachtete Wert der Teststatistik der Stichprobe unter H0 (sehr) selten? p<alpha --> Nullhypothese verwerfen

H0 kann nicht verworfen werden: Abweichung nicht signifikant

H0 wird verworfen: Abweichung signifikant

p-Wert: gibt an, wie viele Stichproben ein mindestens so extremes Ergebnis haben, wie die beobachtete Stichprobe, wenn H0 gilt.

Nullhypothese H0	Alternativhypothese H1
Behauptet, dass kein Effekt/Unterschied/Zusammenhang besteht	Gegenhypothese --> es besteht ein Effekt/ Unterschied/ Zusammenhang

Varianzanalyse (ANOVA)

Vergleich des Lagemaßes, bei mehreren unabhängigen Mittelwerten. Ein- oder mehrfaktoriell möglich, bei mehr als einem Einfluss auch Wechselwirkungen
Voraussetzung: Daten innerhalb der K Stichproben /Gruppen unabhängig, identisch, normalverteilt
Nullhypothese: Lagemaß u für alle Gruppen gleich
Die Gesamtstreuung wird zerlegt in die Streuung zwischen den Stichproben und die Streuung innerhalb der Stichproben.
Ist das Verhältnis der Streuung zwischen den Gruppen im Verhältnis zur Streuung innerhalb der Gruppen groß, so ist dies unter H0 unwahrscheinlich
Alpha-Fehler Kummulierung: Die Irrtumswahrscheinlichkeiten würden sich bei aufeinander gereihten t-tests kumulieren.

Ein signifikantes Ergebnis bei der Varianzanalyse bedeutet nicht automatisch, dass sich die Mittelwerte paarweise signifikant unterscheiden, um dies zu prüfen, müssten t.tests für alle Paarungen durchgeführt werden.

Was ist eine Theorie?

Eine Theorie ist eine Menge von Aussagen über die Beziehung(en) zwischen zwei oder mehr Konzepten oder Konstrukten.

Qualitätskriterien einer wissenschaftlichen Theorie

Logische Korrektheit
Präzision
Originalität
Nützlichkeit
Fruchtbarkeit
Einfachheit
Falsifizierbarkeit
Hoher Allgemeinheitsgrad
Hoher Informationsgehalt
Hoher Bewährungsgrad

Hypothesen

Hypothesen sind Annahmen oder Vermutungen über Tatsachen oder Zusammenhänge, die noch nicht empirisch bewährt sind (sprich eine theoretisch begründete Prognose für ein bestimmtes empirisches Ergebnis).
Eine entsprechende Untersuchung wird dann zeigen, ob die Prognose eintrifft und sich das erwartete Ereignis tatsächlich zeigt und dadurch die Hypothese beibehalten werden kann

Beispiele für unabhängige Variable (x)

Unterrichtsform mit ≥ 2Ausprägungen
Studiengang mit ≥ 2 Ausprägungen
Prüfungszeitraum mit ≥ 2 Ausprägungen
Spielstandorte mit ≥ 2 Ausprägungen
Spielliga ≥ 2 Ausprägungen

Beispiele für numerische Variablen

Alter
Einkommen
Körpergröße
Gewicht
Notendurchschnitt
Anzahl der abgeschlossenen Kurse pro Semester
Studiendauer
Prüfungsergebnisse

Beispiele für abhängige Variable (y)

Punktzahl
Anzahl der Studierenden
Abschlussnote
Gewicht
Tore pro Spiel
Ballbesitz pro Prozent
Anzahl der abgeschlossenen Kurse pro Semester
Studiendauer
Prüfungsergebnisse

Stärken und Schwächen Qualitative vs. Quantitative Methoden

Qualitative Methoden

Quantitative Methoden

Stärken

- Tiefe Einsicht/Verständnis durch detaillierte Beschreibungen

- Flexibilität & Anpassungsfähigkeit, um neue Erkenntnisse und unerwartete Ergebnisse zu berücksichtigen

- Vielfalt der Datenquellen, um ein umfassendes Abbild des Untersuchungsgegenstandes zu erhalten

- Ermöglicht Erforschung von Kontext und Prozessen, die schwer quantifizierbar sind

- Empfindsamkeit für soziale und kulturelle Kontexte, indem sie die Perspektiven der Teilnehmer*innen in den Mittelpunkt stellt

- Generalisierbarkeit durch große und repräsentative Stichprobe, wodurch die Ergebnisse auf eine größere Population verallgemeinert werden können

- Objektivität und Reliabilität

- Präzision und Klarheit

- Effizienz: können oft schneller und kostengünstiger durchgeführt werden, besonders bei großen Stichproben

- Möglichkeit zur Hypothesenprüfung (Identifikation der Ursache-Wirkungs-Beziehung)

Schwächen

- Geringe Generalisierbarkeit aufgrund des kleinen Stichpunkts und des fokussierten Untersuchungsansatzes

- Potenzielle Subjektivität, Interpretation der Daten hängt von den Forschern ab, kann zu subjektiven Einschätzungen & Bias führen

- Zeit- und Ressourcenintensiv, im Vergleich zu quantitativen Methoden

- Schwierigkeiten bei der Standardisierung, da der Fokus auf Einzigartigkeit und Kontextualität liegt

- Vernachlässigung des sozialen und kulturellen Kontextes, kann zu eingeschränktem Verständnis führen

- Eingeschränkte Flexibilität, Standardisierung lässt wenig Anpassung an neue oder unerwartete Erkenntnisse zu

- Oberflächlichkeit: Komplexität menschlicher Erfahrungen/Interaktionen können nicht vollständig erfasst werden

- Potenzial für Verzerrungen, schwierig alle relevanten Variablen zu kontrollieren

- Kleinere Stichproben können zu unzuverlässigen/nicht generalisierbaren Ergebnissen führen, was die Validität der Forschung beeinträchtigt

Join Course

Preview

Author

Johanna O.

Information

Last changed
3 months ago

Report course

WM

Author

Johanna O.

Information