Regressions-Diskontinuitätsanalyse (RDA)
Quasi-Experimentelles Design mit Extrapolierung
Soll Einfluss einer Intervention auf eine Av untersucht werden
Zuweisung zu Gruppen wird an Auspärgung einer kontinuierlichen Zuteilungsvariablen Z festgemacht
Z ist nicht die AV
z.b. nur bei blutdruck >150 wird interveniert (z)
Modellgleichung der RDA
Beispiel kein Effekt der UV
Beispiel: Effekt der UV, für alle Ausprägungen von Z
Beispiel: Effekt der UV, allerdings profitieren kleinere Z mehr als größere Z
Herausforderungen der RDA
Wahl der Zuteilungsvariable (wer bekommt Intervention?)
Wahl CutOff Wert
Fehlspezifikation des Regressionsmodells
Gründe für Fehlspezifikation
nicht-linearer Zusammenhang zwischen Y und Z
Interaktionen zwischen Variablen nicht modelliert
Schätzen von mittleren Treatment-Effekten in RDA-Designs
Mittlerer Treatment Effekt (average treatment effekt,ATE)
Differenz zw. mittleren Ergebnissen von Mitgleidern der IG und Mitgleidern von KG
Lokaler mittlerer Treatment-Effekt (local average treatment effect, LATE)
Lokaler mittlere Treatment Effekt am Cut-Punkt
(daher Bezeuchnung LATEC -> local average treatment effect at the cut-point)
3 Typen von RDA Designs
Scharfe RD Designs
Unscharfe (Fuzzy) RD-Desings Typ I
Imscharfe (Fuzzy) RD-Designs Typ II
Treatment Effekte in scharfen RD-Desings
full compliance der teilnehmenden -> unter cutoff erhält keiner Treatment;über Cutoff erhält jeder treatment
-> Intention to Treat entspicht tatsächlichen Treatment
-> Oft Wunschdenken, haper i.d.R. an Imple,entierung
Mitttlere Treatment Effekt entsspricht der Intention to Treat (TOTC = ITTC)
Unscharfe (Fuzzy) RD-Designs Typ I
In treatment Gruppe erhält nicht jeder Treatment (sog. no shows)
Allerdings: keiner treatment in KG
Annahme: bei no shows gibt es keinen Treamtent effekt
Daher ist der mittleren Effekts am Cut-Punkt des erhaltenen Treatments (TOTC) gleich der mittleren intention to treat (ITTC) relativiert an der Anzahl der Perosnen die wirklich Treatment erhalten haben
Unscharfe (Fuzzy) RD-Designs Typ II
in Treatmentgruppe erhält nicht jeder Treatment (No-Shows)
In KG erhalten einige Treatment (Cross-Overs)
Sind starke Annahmen notwendig, um Effekt schätzen zu können
Indentifikation eines LATE Effektes (1) (Mittlerer Treatment effekt)
Personengruppen bei denen Treatment (UV) nicht vom Design beeinflusst wird
Always takers: Haben Treatment, unabhängig von Studie (T=1)
Never Takers: Haben nicht das Treatemnt, unabhängig von Studie (T=0)
Zusammensetzung der Treatment Gruppe
Compliers (T=1)
Always-Takers (T=1)
Never- Takers (T=0) sind No-Shows
Zusammensetzung der Kontroll-Gruppe
Compliers (T=0)
Always Takers (T=1) sind Crossovers
Never Takers (T=0)
Identifikation eines LATE Effektes (2)
Matching
(Anliegen und Varianten)
Anliegen
Parallelisierung v. IG und KG
Ziel: möglichst vergleichbare Gruppen, um Effekte der Manipulation besser abschätzen zu können (vglbar Randomisierung)
Varianten
Exaktes Matching
1:m Matching
Nearest Neighbour
Full Matching
Radius-Matching (Caliper-Matching)
Matchen über Mahalanobis Distanzen
Propensity Score Matching
Allgemeines Vorgehen beim Matching
Schritte des Matchings
Relevante Kovariaten festlegen, die beim Matching berücksichtigt werden sollen
Nähe bzw. Distanz von Personen definieren (ähnlichkeiten) (Variablen;ggf. Gewichung)
Matchen der Personen auf Basis der Distanz (Methoden: 1:1; 1:m, Full matching)
Qualittät von Matchen überprüfen
Analyse durchführen
Wichtig
Nie AV selbst matchen
Nie Variablen matchen die auf AV zurückgehen
Methoden der Distanzbestimmung
Quadrierte euklidische Distanzen (quadrierte differenzen)
Mahalonobis Distanzen (berücksichtigen Korrelationen zw. Variablen)
Matching über Mahalanobis Distanzen
Nearest Neighbour Matching
(Martix wird nach kleinsten distanzen erstellt)
Vorgehen
Sukzessive wahl von Paaren mit jeweils kleinster Distanz hier:
A-E: 0.65
B-F: 2.77
C-D: 7.15
Problem:
für besitmmte Perosnen sind Distanzen zum Partner nicht minimal (z.b. für B auch E näherer Partner (0.65) als F (2.77)
i.d.R. sind KG aber aich nach anderen Algorithmen als NNM fast identisch
1 zu m Matching
1:1 Matching
Wahl je einer Kontrollperson für jede Person in Treatmentgruppe
Wahl von mehreren Kontrollpersonen für jeden person aus der Treatmentgruppe die insgesamt am besten passen
höhere Power (höheres N, kleinere SE), um unterschiede zw. Gruppen aufzudecken
Unterscheide in nicht-kontrollierten (nicht erhobenen) Variablen werden in der KG probabibilistisch ausgeglichen
Full matching
Herausforderung
Bei 1:m können Personen in KG oder IG übrig bleiben
ungünsitg, besonder bei kleinen Stichproben
Abhilfe
Bei Full-Matching variiert Verhältnis von Einheiten der Treatment und KG (1:1,1:2,4:3)
Gleichzeitige Optimierung einer gemeinsamen Distanzfunktion:
+: Alle Perosnen können gematched werden
-: Komplizierte Algorithmen, hoher rechenaufwand
Propensity score matching
(Grundgedanke)
Multivariates Matching über Mahalanobis-Distanzen ist rechenaufwendig. funtkineirt nciht gut für viele Variablen
Abhilfe/Idee
Mehrdimensionale Unterschiede in Variablen zwischen Treamtent und Kontrollgruppe abbilden
dann nur diese Variable zum matchen nutzen
Technische Umsetzung: logistische Regression
Voraussage der Zugehörigkeit zur Treatment vs KG (AV) über Reihe von Kovariaten (UVs) für die es ggf. Grupenunterschiede gibt
e(x)=P(Y=1/X)
e(X)= Propensity Score, Y= Gruppenzugehörogleit. X= Vektor aus potentiell relevanten Variablen
Logistische Regression
(Propensity Score Matching)
Anmerkungen:
Propensoty score Modell kann kompelx sein (nicht-lineare Effekte, Interaktionen)
Modell (=logistische Gleichung) kein theoretisches Modell
Anwendungen des Propensity Score Matching
Stratifizierung
Gewichtung
Covariate Adjustment
Personen in KG und IG werden nach Propensity score gematcht
Rechnerisch einfacher als Mahalanobis Distanzen, da nur eine Matching Variable
Idee
Vergleich der Gruppen bei Konstanzhalten der Propensity Variablen
Einteilen der Propensity Variablen in 5 Schichten
Dann Vergleich der Gruppen jeweils innerhalb der Schichten
Anschließend aggregieren der Effekte bei Gewichtung für Gruppengröße
Wenn Treatment und Randfaktoren der Gruppenzugehörigkeit korreliert sind, werden Perosnen runter geiwchtet, die aufgrund von Randfaktoren überzufällig das Treatment erhalten
Prozedere
Propensity-Scores werden als inverse Gewichte benutzt
Personen, die mit geringer Wahrscheinlichkeit das Treatment erhalten, werden schwächer gewichtet
Herausforderungen
Instabile Gewichte im Randbereich
Angepasste Analyseverfahren notwendig
Beziehung von Propensity Score und Kriterium linear, quadratisch,..)
Vermischte Datenanalyse (stat. Kontrolle) mit Deisgn (theoretisches Modell)
Balance Diagnostics
Anliegen/odee
überprüfen ob propensity scire geklappt hat
wenn matching klappt, dürfen Kovariaten nicht mehr zwischen Gruppen unterscheiden
Überprüfung der standardisierten Mittelwertunterschiede zw. Propensity-Score gematchter Treatment und Kontrollgruppe
Diskussion Kontrolltechniken
Wann immer möglich, sollte experimetnell vorgegangen werden
Randomisierung und Treatment durch Experimentator
Wenn nicht mögloch: quasi experimentells Vorgehen (treamtent ohne randomisierte Zuweisung), aber sejr gut zwischen Gruppen matchen
Statistische Kontrolle
Regressionsanalyse mit Kontrollvariablen
Ausgangslage
gibt konfondierende Variablen, die mit Treatmentvariablen korreliert sind, somit fraglich ob Treatmentvariable kausal für AV ist
konfundierenden Variablen werden als Pärdiktoren aufgenommen
wenn interessierende Treatmentvariable eine inkrementelle Voraussage über konfundierenden Variablen hinaus behält, spricht dies für Treatment
Oft erfolgt Einbeziehen von Variablengruppen schrittweise, Reihenfolge sollte Theorie folgen
Allerdigns spielt Reihenfolge de Prädiktoren einer multiplen Regression auf einem Schritt keine Rolle
Schrittweise (lin.) Regression der AV Symptomschwere GAS auf demografische Variablen, Arbeitsbezogene Sorgen und Gesundheitsbezogene Sorgen
Last changed10 months ago