Relative Häufigkeit
Häufigkeit einer Kategorie im Verhältnis zu 100%
Gültige Prozente
Prozente ohne fehlende Werte
Kumulierte Prozente
Verschiedene relative Häufigkeiten addiert
Quantile/Median
Berechnet unter welchem Wert ein bestimmter Anteil der Fäll liegt (z.B: Unterhalb welches Werts liegten 25% der Fälle?)
Arithmetisches Mittel
Durchschnitt
Varianz
Streuung: Durschnittliche quadrierte Abstände der einzelnen Werte zum Mittelwert
Standardabweichung
Streuung: Durchschnittliche absolute Abweichung der einzelnen Werte zum Mittelwert
Prozentsatzdifferenz
Unterschied zwischen zwei Prozentwerten
Odds
Verhältnis der Häufigkeit mit der ein Ergebnis im Vergleich zum Gegenergnis auftritt
Odds Ratio
Verhältnis der Odds zueinander
Chi Quadrat
Smme der quadrierten Abweichungen zwischen tatsächlichen beibachteten und theoretischen erwartbaren Häufigkeiten
Cramers V
Normiert Chi-Quadrat auf Wertebereich 0 bis 1
Kendalls Tau
Für jeweils zwei Fälle werden die Ausprägungen der einen Variable mit den Ausprägungen der anderen Variable verglichen
Kovarianz
Wie stark weichen die Werte für x und Y vom Mittelwert ab
Korrelation
Normiert Kovarianz auf einen Wertebereich von -1 und +1
Geradengleichung
Gibt an welcher y Wert für welchen x-Wert (laut Modell) geschätzt wird. Beschreibt mathematisch wie die Gerade aussieht
Welche Formeln kennen wir?
Relative Häufigkeiten
Protenzsatzdifferenz
Odds/Odds Ratio
Kendall´s Tau
Pearson´s r
Regressionskoeffizient
Regressionskonstante
Determinationskoeffizient
z-Standadisierung
Standardfehler
Setzt Kovarianz und Varianz von X ins Verhältnis. Gibt an um wie viel Einheiten sich die AV ändert, wenn die UV Variable um eine Einheit steigt
Konstante
Welcher Wert die AV, wenn UV den Wert 0 hat
Wie groß ist der Anteil der Varianz der AV, der durch die UV erklärt werden kan? [Maß für Stärke des Zusammenhangs zwischen AV und UV]
Korrigiertes R²
Korrigier den Determinationskoeffizienten für die Anzahl der UV
z-Standardisierung
Abstand zwischen einen Wert aus der Stichprobe und dem Mittelwert der Stichprobe, geteilt dirch die Standardabweichung der Stichprobe
(geschätzte) Standardabweichung der Grundgesamtheit geteilt durch die Wurzel der Stichprobenfallzahl. Gibt an wie stark der Stichprobenmittelwert um den Mittelwert der Grundgesamtheit streut.
Konfidenzintervall
Gibt einen Bereich an, in dem wir den tatsächlichen Mittelwert/Anteilswert in der Grundgesamtheit, mit einer bestimmten Irrtumswahrscheinlichkeit, vermuten. Setzt sich zusammen aus Punktschätzer, Standardfehler und dem der Irrtumswahrscheinlichkeit entsprechenden z-Wert (i.d.R. +/- 1,96 oder +/- 2,58).
Grober Überblick über alles
Eine Stichprobe ziehen und Menschen befragten und den Datensatz aufbereiten
Die Stichprobe mit univarianten Maßzahlen beschreiben
Hypothese aufstellen
Zusammenhänge mit bivarianten Maßzahlen überprüfen
Zusammenhänge mit multivarianten Verfahren überprüfen
Mit der Inferenzstatistik eine Aussage über die Übertragbarkeit des Ergebnisses machen
Mit welchem Skalenniveau darf man was machen bzgl. Regression?
Metrisch: Geht sowohl als abhängige als auch als unabhängige Variable, keine weiteren Änderungen notwendig
Ordinal: Muss immer in Dummys umkodiert werden. Immer eine Referenz auswählen, d.h. ein Dummy weniger als die Variable Ausprägungen hat. Kann nur als unabhängige Variable verwendet werden.
Nominal polytom: siehe ordinal.
Nominal dichotom: Nur als unabhängige Variable nutzbar
—>Als abhängige Variable kann man nur metrische Variablen nutzen
—>Als unabhängige Variable können Variablen jeden Skalenniveaus verwendet werden, sie müssen nur entsprechend rekodiert werden: Zu Dummies
Was ist der Unterschied zwischen Intervall und Ratioskalen/Verhältnisskalen?
In beiden Fällen haben die Ausprägungen eine logische Reihenfolge und die Abstände zwischen den Ausprägungen sind gleich groß
Eine Ratioskala hat zusätzlich einen natürlichen Nullpunkt, das heißt der Wert 0 bedeutet wirklich, dass etwas nicht vorhanden ist
Eine Intervallskala hat keinen natürlichen Nullpunkt, wenn es draußen 0 Grad Celsius sind, herrscht nicht “Keine Temperatur”, der 0.-Längengrad der Erde hat nicht “keine Länge”. Im Jahr 0 hatten wir nicht “kein Jahr”. Der Nullpunkt ist hier willkürlich gesetzt
Was sind kategoriale Variablen?
Schwammiger Begriff, wird oft vewendet um nominal und ordinalskalierte Variablen von metrischen Variablen abzugrenzen
m Prinzip: Alle Variablen die mehrere Kategorien (= empirische relative) haben und nicht metrisch sind, z.B.: Familienstand, Bildungsabschlüsse, subjektive Schichteinstufung, Geschlecht
Darunter fallen sowohl nominale (Familienstand, Geschlecht) als auch ordinale Variablen (Bildungsabschlüsse, subjektive Schichteinstufung)
Erhebungsverfahren und -Design
Erhebungsmethoden
Beobachtung
Verhaltensspuren
Befragung
Erhebungsdesigns
Qualitative vs. Quantitative
Querschnitt vs. Längsschnitt
Experimentell vs. Ex-post-facto
Undervoverage
Personen die Teil der Grundgesamtheit sind aber nicht befragt werden können
Overcoverage
Personen die nicht Teil der Grundgesamtheit sind, aber befragt werden
Last changeda year ago