3.1 Problemstellung
Wirksamkeit einer oder mehrerer UV auf AV
—> vermuteter Kausalzusammenhang untersucht
UV (X) = nominal skaliert, kategoriale Variable (Faktorstufe, Kategorien, Gruppe, FAKTOR!)
—> experimentelle Faktoren, Einflussfaktoren
—> immer alternative Zustände (Ausprägungen), die AV vermutlich beeinflussen
AV (Y) = metrisch
—> Zielvariable, erklärende Variable, Messgröße
experimentelle Situationen (UV manipuliert)
—> Testobjekte nach Zufallsprinzip zu Faktorstufe (UV) zugeordnet
nur 1 Faktor (UV) auf 2 Faktorstufen betrachtet = einfacher Test auf Mittelwertunterschiede
—> ab 3 Faktorstufen = ANOVA
Prüfgröße: Streuungen (Varianzen) in Gruppen und zwischen Gruppen
Bsp.
3.2 Vorgehensweise
3.2.1 Einfaktorielle Varianzanalyse
Modellformulierung
= Erklärung, wie Beobachtungswert i der AV, der aus Untersuchungsgruppe (Faktorstufe) g entstamm, reproduziert werden kann
stochastisches Modell der ANOVA
—> Basis Varianzanalysen: Stichproben
—> ANOVA liefert anderer Schätzungen für dasselbe Problem
—> Ziel ANOVA = Rückschlüsse Stichprobe auf Grundgesamtheit ziehen
—> 2 Komponenten: systematische und stochastische Komponente (linear verknüpft)
Modellformulierung: systematische Komponente
systematische Komponente = ob Faktorstufe Auswirkung auf AV besitzt und liefern Erklärungsbeitrag für gemessene AV
stochastische Komponente: Störgröße E = Messfehler + Wirkung nicht betrachteter Variablen
—> Annahme: alle Gruppen ungefähr gleich starke Störeinflüsse
—> Störgröße E = Zufallsgröße (in jeder Beobachtung enthalten)
wichtig: zuerst immer Daten veranschaulichen
Modellformulierung: Auswirkungen
(Effekte) Faktorstufen ergeben sich aus Abweichungen Gruppenmittelwerte vom Gesamtmittelwert
—> Nebenbedingung nötig: z.B. Referenzkategorie, Annahme Effekte gleichen sich aus
Zerlegung der Streuung und Modellgüte
Streuungszerlegung als Grundprinzip der ANOVA (Erklärung Zustandekommen AV)
—> zerlegt Varianz einer AV in erklärten (durch UV ursächlich) + nicht erklärten Anteil (Zufall)
—> Gesamtstreuung = erklärte Streuung + nicht erklärte Streuung (SS = Sum of Square)
Erklärungskraft (Güte) eines varianzanalytischen Modells
—> Berechnung, welcher Anteil Gesamtstreuung durch Modell erklärt (Eta-Quadrat)
Eta-Quadrat = Werte 0-1 (je >, desto höher Anteil erklärte Streuung an Gesamtstreuung)
—> je höher Wert, desto besser erklärt Modell Daten der Stichprobe
—> keine Aussage über Grundgesamtheit
Prüfung der statistischen Signifikanzen
F-Test: Annahme = Varianzen innerhalb Gruppe homogen (Varianzhomogenität)
1. Formulierung H0
2. Berechnung Prüfgröße F empirisch
3. Festlegung Irrtumswahrscheinlichkeit a (Signifikanzniveau) + Entscheidung
—> F empirisch mit F theoretisch verglichen, F a ergibt sich aus Irrtumswahrscheinlichkeit a
—> F emp. > F a = H0 verwerfen (signifikanter Zusammenhang)
—> F emp. <= F a = H0 beibehalten
4. Interpretation
Prüfung der statistischen Signifikanzen: Annahmen ANOVA
Varianzhomogenität und Normalverteiltung
—> Prüfung VH (oder Homoskedastizität) mit Levene-Test
—> geht von H0 aus, dass Varianzen nicht unterschiedlich
—> ANOVA robust gegenüber Schätzfehler, wenn Stichprobe repräsentativ
Interpretation der Ergebnisse
zentralen Ergebnisse in Varianztabelle
—> zeigt, ob Modell signifikanten Einfluss auf AV hat und wie groß Erklärungsbeitrag Modell
F-Test hat Omnibus-Hypothese = prüft ob grundsätzliche Unterschiede zwischen Gruppen
—> nicht ersichtlich, ob eine, mehrere, alle Gruppen unterscheiden + Größe Effekt
Interpretation der Ergebnisse: Analyse Uterschiede
—> Anwender hat vor Analyse theoretische Hypothese wo Mittelwertunterschiede in Faktorstufe vorhanden (mit Kontrastanalyse Hypothesen prüfen)
—> Anwender hat keine Hypothesen, nach F-Test Mittelwertunterschiede zeigen (mit Post-hoc-Test, Anwendung explorativ, hypothesengenerierend)
Interpretation der Ergebnisse: multiple Vergleichtests
Multiple Vergleichstests bei a priori Vermutung: Kontrastanalyse
—> Hinweis, inwiefern Mittelwerte der AV bei Faktorenstufen einer UV unterscheiden
—> z.B. Einfluss Platzierung Effekt, nun vermuten, dass auch Platzierung von X Effekt hat
Multiple Vergleichstest aufgrund signifikanter F-Tests: Post hoc-Test
—> nach F-Test mit signifikantem Ergebnis
—> welche Faktorenstufe Unterschiede in Mittelwerten begründen
—> multiple Tests = gleiche H0 mit mehreren Tests untersucht
—> bei Varianzgleicheit in Gruppen folgende Tests:
Interpretation der Ergebnisse: multiple Vergleichtests aufgrung signifikanter F-Test
a) Bonferroni-Test: paarweise Vergleiche zwischen Gruppenwerte mit t-Test
b) Schaffe Test: gemeinsame paarweise Vergleich zeitgleich für Kombi Mittelwerte (F-Verte.)
c) Tukey-Test: alle möglichen paarweise Vergliche zwischen Gruppen (t-Verteilugen)
—> Alpha-Fehler-Inflation = dieser Test bestimmt Gesamtfehlerrate
3.2.2 ZweifaktorielleVarianzanalyse
2 Faktoren (UV) gleichzeitig betrachtet, durch 2 oder mehr Faktorstufen gekennzeichnet
Rechnung Haupteffekt = alle MW + Gesamt-MW berechnen + Randmittelwerte für Faktoren
—> Unterschiede über alle Stufen/ Faktoren signifikant = unterschiedliche Haupteffekte auf AV
Modellformulierung: 2 Modelle
faktorielles Design = gleichzeitige Variation von 2 oder mehr Faktoren
—> Vorteil: Wechselwirkungen (Interaktionseffekte) zwischen Faktoren untersuchen
—> Vorteil: nichterklärte Varianzen verringern und Nachweis Faktorwirkung erleichtert
stochastisches Modell = aus systematischen und stochastischer Komponente E
—> zur eindeutigen Bestimmung Effekte vereint, jeweils zu 0 addiert
—> isolierte Effekte der Faktoren = Haupteffekte
Modellformulierung: Prüfung Interaktionseffekte
—> wenn 2 Stufen eines Faktors Absatzmenge auf Stufe 2. Faktor beeinflussen
—> durch Signifikanz prüfen
a) H0: MW Faktorstufen identisch, daher keine Interaktion zwischen Faktoren
b) H1: MW Faktorstufe nicht identisch, daher Interaktion zwischen Faktoren
Modellformulierung: Interaktionseffekte 3x
Ordinale Interaktionseffekt = Rangfolge Stufen des einen Faktors für Stufe des anderen Faktors identisch (gemeinsamer Trend, schneiden sich nicht)
—> Haupteffekt isoliert interpretierbar, schwacher Effekt auf AV
disordinale Interaktionseffekt = kein gemeinsamer Trend Faktoren erkennbar
—> Linienbezüge laufen in unterschiedliche Rechnung, keine Interpretation möglich
—> stärkster Effekt auf AV
Hybride Interaktionseffekte = beiden anderen Effekte gleichzeitig
—> Interpretation nur für einen der beiden Einflussfaktoren möglich
Streuungszerlegung: zur Beurteilung Signifikanz der Effekte
—> auch in erklärte und nicht erklärte Streuung aufgeteilt
—> erklärte in 3 Komponenten aufgeteilt (2 Faktoren, 1 Interaktion)
Streuung zwischen Gruppen (erklärte) = als Differenz zwischen GruppenMW + GesamtMW
nicht erklärte Streuung = werden auf Faktoren noch Interaktionseffekte zurückführbar
Erklärungskraft varianzanalytischen Modells —> auf Basis Streuungszerlegung Güte Modells beurteilen —> zusätzlich zu Eta-Quadrat, partielle Eta-Quadrat-Werte für jeden Faktor + Interaktionsterm
Prüfung auf unterschiedliche Wirkungen Faktoren durch Vergleich Mittelwerte in Zellen
alle MW ungefähr gleich = Faktoren keine Wirkungen (H0 stimmt)
—> H1 = mind. 1 Faktorstufe hat Einfluss
globaler Signifikanztest für zweifaktorielles Modell identisch mit Test für einfaches Modell
zentrale Ergebnisse in ANOVA-Tabelle zusammengefasst
—> Erweiterung: SS für beide Faktoren + Interaktion zwischen Faktoren aufgeführt
Ergebnisse in Varianztabelle (zeigen, ob betrachtete Faktoren oder Interaktion signifikanten Effekt auf AV hat)
F-Statistik mit Omnibus-Test: keine Auskunft, welche Stufe signifikanten Einfluss auf AV + Größe Effekt
a priori Vermutung = mit Kontrastanalysen testen
—> sonst Post-hoc-Test oder signifikanter F-Test
3.4 Modifikationen und Erweiterungen
3.4.1 Verfahrenserweiterungen
Erweiterung durch Einbeziehen weiterer Variablen
alle Verfahrensvarianten = Streuungszerlegung
—> je mehr Faktoren, desto mehr Interaktionsbeziehungen
dreifaktorielles ANOVA = umfasst Interaktion zwischen Kombis von 2 Faktoren + Interaktion aller 3 Faktoren
—> Wechselwirkung kaum inhaltlich interpretierbar
MANOVA = mehr AVs + mehr Faktoren
MANCOVA = mehr AVs + zusätzlich metrisch skalierte Kovariare
Tabelle
3.4.2 Kovarianzanalyse (ANCOVA)
Kovariate = metrisch skalierte UV
ANCOVA = Varianzanalyse mit Kovariate
zusätzlich zu nominal skalierte Faktoren auch metrisch skalierte Kovariate
folgt linearen Modellansatz (Faktoren + Kovariate müssen unabhängig sein, keine Interaktion)
Korrelation zwischen Kovariaten und AV erforderlich, vorab prüfen
Beitrag Kovariate zur Erklärung AV vorab durch Regressionsanalyse geprüft
durch Berücksichtigung Kovariaten keine pos-hoc-Tests Ergänzung möglich
Prüfung der Varianzhomogenität mithilfe des Levene-Tests
prüft H0, dass Varianzen in Gruppen nicht unterscheiden
3.5 Anwendungsempfehlungen
Modellformulierung und Annahmen der Varianzanalyse
- ANOVA ist konfirmatorische (struktur-prüfende) Analyse
- Sachlogik, Fachwissen, Theorie wichtig für Einflussvariable auf AV zu identifizieren
- AV metrisch, UV kategorial ausgeprägt
- bei 2 oder mehr Varianzanalyse müssen Faktoren andere Einflussquellen auf AV darstellen
- Störgrößen: dürfen keine systematische Einflussgrößen enthalten
- Annahme Varianzhomogenität
- Annahme multivariate Normalverteilung
Variablenauswahl und Erhebungsplanung
- Manipulation check: Veränderung in Beobachtung AV auf verschiedene Faktorstufen der Faktoren zurückführbar
- Anzahl Faktoren: mind. 1 Faktor mit 3 oder mehr Faktorstufen untersuchen
- Anzahl Beobachtung: viel, je mehr Faktoren desto mehr Beobachtungen nötig
- pro Gruppe mind. 20 Beobachtungen
Empfehlungen bei er praktischen Durchführung
- Modellkomplexität: zu Beginn nicht zu viele Faktoren gleichzeitig, für leichte Interpretation
- Ausreißeranalyse: Einfluss auf Varianzen + auf Varianzhomogenität, Normalverteilung
- Problem unvollständiger Versuchspläne
Zuletzt geändertvor 2 Jahren