Ursprung und Definition
Edward Hugh Simpson (1951) beschrieb als erster das statistische Phänomen
Konfundierung mit einer Drittvariablen
Ergebnisse in Teilgruppen unterscheiden sich von dem Aggregat
Effekte können sich sogar im Vorzeichen umkehren
tritt auf, wenn keine Randomisierung erfolgt
Problem: oft keine Randomisierung möglich
schwer vorherzusagen, welche Drittvariablen wichtig sind, deshalb versuchen möglichst viele Kovariaten miterheben
≠ Stichprobenverzerrung (sampling bias)
Beispiele
Evaluation der Wirksamkeit einer neuen Therapie
Diskriminierungsklage gegen die University of Berkeley
Überlastung und Arbeitszufriedenheit
Todesfalle Uniklinik
Hautfarbe und Todesstrafe
Studiendauer und Gehaltshöhe
Pünktlichkeit von Fluglinien
Trefferquote beim Elfmeterschießen
Arbeitslosigkeit und NSDAP-Wähleranteil
Erziehungsstil und Alter der Eltern
Bildung und Arbeitslosenquote
verwandte Phänomene
Gerrymandering
Will-Rogers-Phänomen
Evaluation neuer Therapieformen
Konfundierung der Behandlung mit dem Stadium der Erkrankung
unterschiedliche Gruppenzusammensetzung
unterschiedliches n - Power max. wenn n gleich
Heilungsraten:
Wie wird das gewichtete Mittel (Aggregat) gebildet?
Grafische Darstellung
Durchmesser der Kreise = n
Konfudierung mit Fakultät (Department)
unterschiedliche Annahmechancen
Männer bewerben sich eher an Fakultäten mit höheren Annahmechancen
in jeder einzelnen Fakultät wurden Frauen jedoch eher angenommen als Männer (umgekehrt)
Todesfalle Uniklinik?
Konfundierung mit Schweregrad der Erkrankung
Effektstärke: 2.6 % Range
Problem der Veröffentlichung von “Erfolgsraten”
“Wie sehr befriedigt Sie Ihre Arbeit?”
Konfundierung mit Position
je mehr Verantwortung, desto mehr Autonomie und daher Zufriedenheit
Mitarbeiter in verantwortlicher Position sind generell zufriedener mit ihrer Arbeit
Überlastung reduziert jedoch Arbeitszufriedenheit unabhängig von der Position
Todesstrafe in Abhängigkeit der Hautfarbe
es scheint als würden Weiße eher zu Tode verurteilt werden
Konfundierung mit Hautfarbe des Opfers
Weiße bringen eher Weiße um
in den Teilgruppen werden jedoch Schwarze häufiger verurteilt
bei weißen und schwarzen Opfern
in allen Studienfächern sinkt das Gehalt mit zunehmender Studiendauer
insgesamt steigt das Gehalt jedoch
Konfundierung mit Studienfach
schwierige Studienfächer dauern länger, werden jedoch eher entlohnt
Pünktlichkeit von Fluggesellschaften
Konfundierung mit Flughafen
Alaska Airlines flog hauptsächlich Flughäfen mit hoher Unpünktlichkeit an
Trefferquoten beim Elfmeterschießen
Konfundierung mit Heim- vs. Auswärtsspiel
Trefferquote höher auswärts
Spieler 1 trifft immer häufiger als Spieler 2
jedoch spielt Spieler 2 häufiger auswärts
choking under pressure
= Versagen unter Druck
kann erklären, warum Trefferquote höher auswärts
jedoch umstritten
Hospitalisierung und Impfung
kein Simpson-Paradoxon: Aggregat in Teilstichprobe
45% aller COVID-Patienten im Krankenhaus waren geimpft
-> “deshalb sind Impfungen gegen eine SARS-CoV-2-Infektion wirkungslos”
90% aller gestohlenen Fahrräder waren abgeschlossen
-> “deshalb ist das Abschließen mit einer Fahrradkette keine wirksame Maßnahme gegen Diebstahl”
-> base rate fallacy
Richtung der bedingten Wahrscheinlichkeit muss berücksichtigt werden
p (geimpft | hospitalisiert) ≠ p (hospitalisiert | geimpft)
base rate fallacy
Fehlschluss aufgrund verschiedener Basisraten / Prävalenzfehler
Basisrate/Prävalenz muss berücksichtigt werden
Daten des israelischen Gesundheitssystems
Wirksamkeit einer Impfung gegen schweren Verlauf
1 - V/U: % Reduktion des Anteils schwerer Fälle in der geimpften relativ zur ungeimpften Gruppe
V = Schwere Verläufe pro 100.000 vollständig Geimpfte
U = Schwere Verläufe pro 100.000 Ungeimpfte
-> 67.5% der schweren Fälle werden durch die Impfung verhindert
wenn V = U -> Wirksamkeit = 0
Hospitalisierung und Alter
Situation in Israel im August 2021
große Altersunterschiede in der Impf- und Hospitalisierungsrate:
90% der > 50-Jährigen sind geimpft
73% der < 50-Jährigen sind geimpft
85% der Ungeimpften sind < 50 Jahre alt
Ältere (> 50 Jahre) kommen über 20x häufiger ins Krankenhaus
-> Alter sowohl mit der Impfrate als auch mit der Hospitalisierungswahrscheinlichkeit konfundiert
ohne Berücksichtigung der doppelten Konfundierung erscheinen Impfungen weniger wirksam, weil Geimpfte häufig älter waren (und deshalb häufiger erkrankten)
Wirksamkeit der Impfung bei Kontrolle des Alters
in jedem Jahr negative Korrelation zwischen % NSDAP und Arbeitslosigkeit
insgesamt stieg die Arbeitslosigkeit jedoch über die Jahre und die Zustimmung für die NSDAP
Konfundierung mit der zeitlichen Entwicklung
positiver Zusammenhang zwischen beiden Variablen
im Aggregat jedoch negativer Zusammenhang
Konfundierung mit dem Alter der Eltern
ältere Eltern zeigen mehr emotionale Wärme
jüngere Eltern unterstützen ihre Kinder eher bei der Selbstverwirklichung
Arbeitslosenquote in den USA war im Oktober 2009 insgesamt niedriger als während der Rezession in den 80ern (8.2% vs. 8.5%)
in den Teilgruppen mit unterschiedlichem Ausbildungsstand war sie jedoch höher höher im Jahr 2009
über die Zeit jedoch prozentual weniger Menschen in der Gruppe der “high school dropouts”
Gerrymandering (Wahlkreisschiebung)
benannt nach Governor Ellbridge Gerry
Wahlbezirk in Salamanderform
Manipulation von Wahlkreisgrenzen in einem Mehrheitswahlsystem zur Maximierung der eigenen Erfolgsaussichten
ein reines Verhältniswahlrecht (nicht nur ein Abgeordneter pro Bezirk, sondern proportional zur Bevölkerung) macht Gerrymandering unmöglich
Problem in USA, weil die Parteien selbst an der Wahkreiszuschneidung beteiligt sind
-> Beeinflussung des Wahlergebnisses trotz gleichbleibenden Stimmverhaltens
Techniken des Gerrymandering
Verdünnung: möglichst viele Wahlkreise werden so gezogen, dass die Opposition sie nicht gewinnen kann und dadurch möglichst viele oppositionelle Stimmen verfallen
Hochburgbildung: in einem („Wegwerf“-)Wahlkreis werden möglichst viele Wähler der Opposition zusammengefasst, damit die Opposition zwar diesen Wahlkreis mit hohem (aber irrelevantem) Vorsprung gewinnt, ihr dafür aber in mehreren umliegenden Wahlkreisen Stimmen zum Wahlsieg fehlen
Vorwurf, dass dies mit “schwarzen Wahlbezirken” in den USA geschieht
Eine Hand wäscht die andere:
beide Parlamentsfraktionen teilen gemeinsam die Wahlkreise so auf, dass derzeitige Sitzinhaber mit großer Wahrscheinlichkeit wiedergewählt werden, während Gegenkandidaten wenig Chancen haben
der Status Quo kann so leichter verteidigt und anstrengende Wahlkampagnen und schwer zu haltende Wahlversprechen können vermieden werden, die Abgeordneten müssen kaum noch Rücksicht auf die Wechselwähler der politischen Mitte nehmen und können dadurch leichter auf die (linke oder rechte) Parteilinie gebracht werden
Zusätzliche Probleme des Gerrymandering
es werden keine attraktive Kandidaten mehr vorstellt
so können extreme Kandidaten aufgestellt werden, die in der Partei zwar beliebt sind, für das Elektorat aber zu extrem sind
Wahlkampagnen überflüssig, da der Sieger feststeht
Entwicklung des 7. Wahldistrikts von Pennsylvania
Verbot von Gerrymandering in Florida
Floridas 5. Wahldistrikt beinhaltete von 2011 bis 2015 so gut wie die einzigen schwarzen Stadtteile von Jacksonville und Orlando
-> Wegwerfhochburg
2010: Verabschiedung des Verfassungszusatzes, dass die Wahlkreiseinteilung keine Partei und keinen Amtsinhaber bevorzugen oder benachteiligen darf
Wahlkreise müssen zusammenhängend und kompakt sein
2015: Aufhebung der (zuletzt) 2011 verabschiedeten Wahlkreiseinteilung durch den Obersten Gerichtshof Floridas
Städtische vs. ländliche Gebiete
es kommt zu einer natürlichen Verdünnung durch die Wähler
mehr Menschen ziehen in die Stadt
Präferenzen in der Stadt eher demokratisch
-> überproportional viele Wähler in der Stadt
Wählerwanderung muss ausgeglichen werden, indem die Wahlbezirke neu angeordnet werden
Maße für Gerrymandering
“wasted vote effect”
gerrymander index score / compactness score
“Wasted vote effect”
Zahl der “verschwendeten Stimmen” für die miteinander konkurrierenden Parteien über alle Wahlbezirke hinweg ist ein Maß für die durch Gerrymandering erzeugte Ineffizienz
Summe aus der Zahl der erhaltenen Stimmen, die nicht für den Wahlsieg gereicht haben, und der Zahl der überzähligen Stimmen (die für den Wahlsieg gar nicht mehr nötig gewesen wären) werden an der Gesamtzahl der abgegebenen Stimmen relativiert
bei hoher Ineffizienz kann eine Partei mit einer Minderheit der abgegebenen Stimmen eine Mehrheit der zu vergebenden Sitze erringen
kann genutzt werden, um das Gerrymandering bei der nächsten Wahl zu schätzen
dagegen handeln
Gerrymander index score / compactness score
Polsby-Popper-Test: je mehr der tatsächliche Umfang eines Wahlbezirkes vom mathematisch kleinstmöglichem Umfang mit derselben Fläche abweicht, um so höher ist der Grad des Gerrymanderings
kleinstmöglicher Umfang mit derselben Fläche = Kreis
kann schon vor der Wahl berechnet werden
Effekt der Mittelwertbildung in Gruppen
Sonderfall: durch den Wechsel eines Elements von einer zur anderen Gruppe kann sich der Mittelwert in beiden Gruppen erhöhen
oder sinken (inverses Will-Rogers-Phänomen)
benannt nach einem amerikanischen Komiker aus Oklahoma: „Einwohner von (O)klahoma, die Oklahoma verlassen und nach (K)alifornien ziehen, erhöhen den durchschnittlichen IQ beider Bundesstaaten“
Praktische Relevanz des Will-Rogers-Phänomens
wenn die besten Schüler aus den (R)ealschulen ins (G)ymnasium wechseln, sinkt der Mittelwert der Leistungen in beiden Schulformen
PISA-Studie: Leistung eines Schülers hängt von der Leistung der anderen Schüler ab
-> Auswirkungen auf die Leistungen des einzelnen, wenn das Nieveau sinkt
Will-Rogers-Phänomen in der Diagnostik von Tumoren
Heilbarkeit von Tumoren steigt
dabei Vergleich der Heilbarkeit von kleinen vs. großen Tumoren
durch verbesserte Diagnosemöglichkeiten werden immer kleinere Tumore erkannt und zuvor kleine Tumore wandern in die Gruppe der großen Tumore
dadurch werden beide Gruppen insgesamt ungefährlicher
-> für beide Gruppen scheint sich die Heilbarkeit zu verbessern
kein medizinischer Fortschritt der Heilbarkeit, sondern nur der Diagnosemöglichkeit
Will-Rogers-Phänomen bei menschlichen Urteilen
Probanden werden Listen mit verschiedene einzelnen Zahlungen gezeigt
sie sollen dann den Mittelwert schätzen
Höhe der durchschnittlich geleisteten Zahlungen tatsächlich: $ 4,08
Schätzungen dieses Mittelwerts jedoch von den Mittelwerten der Einzelgruppen beeinflusst
allerdings nur, wenn die Gruppenmittelwerte zuerst gezeigt und so salient gemacht werden
Last changed9 months ago