Nennen Sie Vor- und Nachteile von numerischen Zusammenhangsmaßen!
Vorteile:
Beschreibung der Beziehungen anhand eines numerischen Maßes
Aussagen über die Stärke des Zusammenhangs
Vergleich der Stärke mit anderen (Stichproben-)Daten
Nachteile:
Zusammenhangsmaße können manipuliert werden
zB durch willkürliche Gruppierung der interessierenden Daten und Untersuchungseinheiten
zB durch (nachträgliche) Bildung von Kategorien einer Variablen
Unterscheiden Sie Kontingenz- und Indifferenztabellen!
Kontingenztabelle: nur beobachtete Häufigkeiten
Indifferenztabelle: nur erwartete Häufigkeiten
Erläutern Sie den Ablauf der Bestimmung von Chi²!
Bestimmung der Differenz zwischen erwarteten (fe) und beobachteten Werten (fb).
Quadrierung der Differenzen
=> gleiche Vorzeichen
positive Werte
größere Differenzen werden stärker berücksichtigt
Relativierung durch erwartete Werte (Division)
Summe über alle Zellen (i,j)
Geben Sie Eigenschaften von Chi² an!
Frage nach der Abweichung von der Unabhängigkeit zweier Variablen
Chi² = 0 => erwartete und beobachtete Werte gleich
Chi² > 0 => Abweichungen von der Unabhängigkeit
maximaler Wert der Abweichung ist variabel und nicht standardisiert
Erläutern Sie die Begriffe Signifikanz/Irrtumswahrscheinlichkeit!
Signifikanz
relevante Größe aus der Inferenzstatistik (“schließenden Statistik”)
Schlussfolgerung von einer Stichprobe auf die Grundgesamtheit
S. (exakt: Irrtumswahrscheinlichkeit) sagt aus, ob ein Zusammenhang zwischen zwei Variablen durch “Zufall” erklärt oder auf die Grundgesamtheit übertragen werden kann
Irrtumswahrscheinlichkeit (p-Wert):
Fehlerwahrscheinlichkeit, einen Effekt anzunehmen, obwohl es in der Grundgesamtheit keinen gibt
Wahrscheinlichkeit, dass man die Alternativhypothese behauptet, obwohl die Nullhypothese gilt
Erläutern Sie die Begriffe Nullhypothese und Alternativhypothese!
Nullhypothese H0:
Zufall => Der Effekt existiert in der Stichprobe, aber nicht in der Grundgesamtheit
Alternativhypothese H1:
kein Zufall => Der Effekt existiert in Stichprobe und Grundgesamtheit
Geben Sie die Beurteilungsklassen der Irrtumswahrscheinlichkeit an!
p > 0,05
nicht signifikant, n.s.
0,05 < p < 0,1
Trend (Hinweis auf weitere Untersuchung)
p < 0,05
signifikant
p < 0,01
hoch signifikant
p < 0,001
höchst signifikant
Nennen Sie Einflussgrößen auf die Signifikanz!
Größe der Stichprobe
Stärke des Zusammenhangs
Erläutern Sie, wieso aus empirischer Signifikanz nicht automatisch praktische Relevanz folgen muss!
zB bei geringer Stärke des Zusammenhangs
zB Durchführung einer komplizierten OP bei minimaler Chance auf Verbesserung des Gesundheitszustands hierdurch
Beschreiben Sie den Ablauf der Bestimmung der Signifikanz!
Beobachtung eines Effekts in der Stichprobe
Hypothesen zum Auftreten dieses Effekts
Nullhypothese H0
Alternativhypothese H1
Signifikanztest: Bestimmung der Irrtumswahrscheinlichkeit
Annahme: H0 würde stimmen
Fragestellung: Wie groß ist die Wahrscheinlichkeit, dass ein mindestens so großer Wert durch Zufall zu erklären ist?
Feststellung dieser Wahrscheinlichkeit
Entscheidung H0 oder H1?
Ist die Irrtumswahrscheinlichkeit relativ groß, nehmen wir H0 an
Ist die Irrtumswahrscheinlichkeit relativ gering, nehmen wir H1 an
Beschreiben Sie symmetrische nominale Zusammenhangsmaße und nennen drei Beispiele!
symmetrische standardisierte Zusammenhangsmaße auf Nominalskalenniveau basieren auf ꭕ²
keine Richtung des Zusammenhangs => genaue und kritische Untersuchung der Kreuztabelle notwendig
Beispiele:
Phi 𝛟: nur beim Wertebereich 2x2 (“Vierfeldertafel”)
Kontingenzkoeffizienz C
nur bei quadratischen Wertebereichen >2x2 (zB 3x3, 4x4)
schwierig zu vergleichen
Cramer’s V:
Wertebereiche für größere Tabellen (zB 2x3, 3x4)
unabhängig von Tabellengröße
Geben Sie die Beurteilungsklassen der Stärke von Zusammenhängen bei der Interpretation standardisierter Zusammenhangsmaße an an!
0
kein Zusammenhang
0 – 0,1
in praxi kein Z.
0,1 – 0,2
sehr schwacher Z.
0,2 – 0,3
schwacher Z.
0,3 – 0,5
mittlerer Z.
0,5 – 0,6
starker Z.
> 0,6
sehr starker Z.
1
perfekter Z.
Nennen Sie drei Beispiele für asymmetrische nominale Zusammenhangsmaße!
basieren auf der proportionalen Fehlerkorrektur
Lambda
Goodman und Kruskal
Unsicherheitskoeffizient
Erläutern Sie den Begriff der ordinalen Zusammenhangsmaßesowie Proportionalität!
auch Rangkorrelationsmaße genannt
basieren auf Prinzip des Vergleichs der Wertepaare (xi, yi)
Häufigkeiten der verschiedenen Arten der Wertekombinationen als Basis
ab Ordinalskalenniveau
standardisierte Zusammenhangsmaße geben Auskunft über die Stärke und die Richtung des Zusammenhangs
Richtung eines Zusammenhangs: Proportionalität
direkt proportional (+): steigt x, dann steigt y
indirekt proportional (-): steigt x, dann sinkt y
Nennen Sie zwei Beispiele für ordinale Zusammenhangsmaße und beschreiben Sie die Voraussetzung für deren Anwendung
Kann zwischen uV und aV eindeutig unterschieden werden?
Nein: symmetrische Beziehung => Kendall’s Tau b tb
Ja: asymmetrische Beziehung => Somer’s d
Nennen Sie zwei Möglichkeiten zur Darstellung von nominal-/ordinalskalierten Variablen!
1) gruppierte (“clustered”) Balkendiagramme
2) gestapelte (“stacked”) Balkendiagramme
Nennen Sie einen Vor- und Nachteil von gruppierten Balkendiagrammen!
Vorteil: häufig sehr gut zur deskriptiven Darstellung geeignet
Nachteil: erschwerte Interpretation von Zusammenhängen aus Grafiken, da unterschiedliche Stichprobengrößen verzerrend wirken
=> daher: gestapelte (“clustered”) Balkendiagramme zur Illustration von Zusammenhängen
Nennen Sie die Berechnungsgrundlage metrischer Zusammenhangsmaße und erläutern Sie dessen Berechnung!
Kovarianz:
Berechnung der arithmetischen Mittelwerte beider Variablen
Differenzen aller Messwerte zum jeweiligen Mittelwert
Produkt beider Abstände
Aufsummierung
Division durch n-1 => “Mittel” der Abweichungsprodukte
Nennen Sie metrische Zusammenhangsmaße bei symmetrischen und asymmetrischen Beziehungen!
symmetrisch:
Pearson’s r
Spearman’s rho
assymetrisch:
einfache lineare Regression
Erläutern Sie Eigenschaften von Pearson’s r!
gängiges metrisches Zusammenhangsmaß bei symmetrischer Beziehung
Vorteil: Berücksichtigung aller Messwerte
Standardisierung der Kovarianz
Relativierung der Standardabweichungen
Regeln bei Interpretation: zuerst die Stärke beurteilen, dann Richtung (Proportionalität), schließlich Signifikanz (genauer: Irrtumswahrscheinlichkeit)
Voraussetzungen für die Anwendung:
metrisches Skalenniveau
keine bzw. sehr wenige Extremwerte
Normalverteilung der Variablen
Erläutern Sie Eigenschaften von Spearman’s rho!
falls Voraussetzungen für Pearson’s r nicht erfüllt
basiert nicht auf Prinzip der Kovarianz, sondern auf Rangkorrelationen (Umwandlung der Messwerte in Rangwerte) => eher den ordinalen Zusammenhangsmaßen zuzuordnen
Reduktion des Skalenniveaus
Regeln bei Interpretation: zuerst die Stärke beurteilen, dann Richtung (Proportionalität, schließlich Signifikanz (genauer: Irrtumswahrscheinlichkeit)
Regeln bei Interpretation: wie Persons’s r: zuerst die Stärke beurteilen, dann Richtung (Proportionalität), schließlich Signifikanz (genauer: Irrtumswahrscheinlichkeit)
Scatterplots (Streudiagramme) eignen sich zur grafischen Darstellung metrischer Zusammenhänge. Geben Sie für die folgenden Diagramme an, welcher Zusammenhang anhand der Darstellung zu vermuten ist:
links oben: direkt proportionaler Zusammenhang
rechts oben: indirekt proportionaler Zusammenhang
unten: kein Muster => kein Zusammenhang
Unterscheiden Sie die Begriffe Korrelation und Regression!
Korrelation: Wie stark ist der Zusammenhang zwischen X und Y? Welche Richtung hat dieser Zusammenhang?
Regression: Kann auf Basis des Zusammenhangs eine Vorhersage eines Wertes von Y durch einen Wert von X getroffen werden?
Erläutern Sie die Begriffe Regressionsgerade, Regression, Residual/Residuum, Total und Güte bei der linearen Regression!
Regressionsgerade:
bestangepasste Gerade in einem Streudiagramm zweier Variablen
Berechnung mittels Methode der kleinsten Quadrate
Regression:
erklärte Abweichungsquadrate
Residual/Residuum
aufsummierte quadrierte Differenzen zwischen beobachtetem Wert und vorhergesagtem Wert (Punkt auf der Regressionsgeraden)
nicht erklärte Abweichungsquadrate
Total:
gesamte Fläche der Abweichungsquadrate
Güte:
quadriertes Verhältnis von erklärten Abweichungsquadraten zu gesamten Abweichungsquadraten
R² = (Regression/Total)²
Interpretieren Sie folgendes Beispiel einer linearen Regression!
Stärke des Zusammenhangs: standardisierter Korrelationskoeffizienz beta : 0,669 => sehr starker Zusammenhang
Richtung des Zusammenhangs: Beta > 0 => positiv, direkter Zusammenhang
Signifikanz: 0 => höchst signifikant
=> sehr starker, höchst signifikanter direkt proportionaler Zusammenhang
Güte der Regression: 0,447 => 44,7% der Streuung der aV kann durch die uV erklärt werden
Nennen Sie den Ablauf zur Interpretation einer linearen Regression!
1) Stärke
2) Proportionalität
3) Güte der Regression r²
4) Beschreibung der erklärten und nicht erklärten Abweichungsquadrate
5) Signifikanz
6) grafische Darstellung inkl Regressionsgerade
7) Prognose und Schätzung
Wann gilt eine Güte einer linearen Regression als akzeptabel?
keine allgemeinen Kriterien
in Sozialwissenschaften: ab 30%
Erläutern Sie die Vorgehensweise zur Bestimmung der Zusammenhangsmaße bei unterschiedlichen Skalenniveaus der Variablen!
Hierarchie des Skalenniveaus beachten => nur auf Ebene des niedrigeren Skalenniveau rechnen
=> Zusammenhangsmaß des niedrigeren Skalenniveaus verwednen
Ausnahmen:
Behandlung bestimmter Ordinalskalen als Intervallskalen, falls:
Minimum 5 Ausprägungen
Intervalle etwa gleich groß (auch keine offenen Randklassen)
Behandlung dichotomer Variablen als Intervallskalen,falls
inhaltlich nominal, formal aber intervallskaliert
Mittelwert entspricht Anteil der höher codierten Ausprägung
Ergänzen Sie folgende Übersicht gängiger Maße der bivariaten Analyse!
Last changeda month ago