Die Multivariate Varianzanalyse (MANOVA) (1)
Multivariate Verallgemeinerung der ANOVA
—>Bei der MANOVA werden mehrere AVn gleichzeitig verglichen
• Fragestellung: Unterscheidet sich das Mittelwertsmuster der AVn zwischen Gruppen bzw. Messzeitpunkten?
Grundprinzip der MANOVA (3)
– Die AVn werden durch eine Linearkombination zu einer neuen AV zusammengefasst
• Die AVn werden zu einer (oder mehreren) „Composites“
(Linearkombinationen/Faktoren/Diskriminanten) zusammengefasst:
– Die Gewichte der AVn werden dabei so gewählt, dass Mittelwertsunterschiede zwischen den Gruppen maximiert werden: Die Gewichte (w1, …, wk) werden so bestimmt, dass der F-Wert maximiert wird
– Große Varianz zwischen den Gruppen
– Kleine Varianz innerhalb der Gruppen
– Es wird dann geprüft, ob sich der Mittelwert dieser neuen AVn zwischen verschiedenen Gruppen signifikant unterscheidet
Vorteil: Es gibt nur einen Test und damit keine α-Fehler-Kumulierung
• Die Composite-Scores können auch zur Klassifikation (Vorhersage der Gruppenzugehörigkeit) verwendet werden
—>Diskriminanzanalyse
Multivariater Fragestellungen (2)
• Multiple univariate Fragen
– Es wird geprüft, ob sich Gruppen in Bezug auf ein Reihe von Kriterien
unterscheiden
– Beispiel: Sind Experimentalgruppe und Kontrollgruppe vergleichbar in Bezug
auf Alter, Bildung, Intelligenz, …
– Um eine Alphafehlerkumulierung zu verhindern, werden alle Kriterien simultan
mit einer MANOVA verglichen
• Intrinsisch multivariate Fragen
– Gruppen werden in Bezug auf ein multidimensionales Konstrukt verglichen
– Es interessiert nicht der Effekt auf einzelne Variablen, sondern auf das
gesamte Set
– Beispiel: AV Affekt (Variablen: Verhalten, subjektives Erleben,
psychophysiologische Reaktionen)
– Beispiel: AV Therapieerfolg (Variablen: Patientenrating, Therapeutenrating)
– Beispiel: AV Studieninteressen (Variablen: Verschiedene Studienbereiche)
Statistische Hypothesen (2)
Die Nullhypothese (𝐻0): Die Vektoren der Mittelwerte alle AVn (1 𝑏𝑖𝑠 𝑘) sind in der Population identisch für alle Gruppen (1 𝑏𝑖𝑠 𝑝):
Die Alternativhypothese (𝐻1): Die Vektoren der Mittelwerte alle AVn (1 𝑏𝑖𝑠 𝑘) unterschieden sich zwischen mindesten zwei Gruppen
Beispiel - Unterscheiden sich die Studieninteressen zwischen OBAC und DCP Studierenden?
• UV: Studienschwerpunkt
• AVn: Interesse für… [0 - 6]
– Psychische Störungen
– Personalauswahl
– Statistik
Design (3)
• Auswahl der AVn
– Die Auswahl der AVn muss sorgfältig erfolgen und theoretisch gut begründet sein
– Ein Gruppenunterschied auf einer einzigen AV führt zu einem signifikanten F-Test
– Zu viele AVn schwächen die Power
• Auswahl der UVn (Faktoren)
– Wie bei der ANOVA können mehrfaktorielle Designs mit mehreren Stufen pro
Faktor verwendet werden
– Es können Messwiederholte und Gruppenfaktoren verwendet werden
• Kovariaten: MANCOVA (Multivariate ANalysis of COVAriance)
– Ziel: Reduktion der Fehlervarianz (𝑀𝑆𝑤𝑖𝑡ℎ𝑖𝑛)
– Effektive Kovariaten
• Hohe Korrelation mit den AVn
• Geringe Korrelation mit den UVn (geringe Gruppenunterschiede)
– Zu viele Kovariaten schwächen die Power! Faustregel für die maximale Anzahl von Kovariaten bei einem Design mit 𝑝 Gruppen (Zellen) (Hair, 2006) max(𝑛_𝑐𝑜𝑣) = 0.1 ⋅ 𝑁 − (𝑝 − 1)
Power (Teststärke) (2)
• Die Power kann direkt über Stichprobengröße beeinflusst werden
• Notwendige Anzahl von Vpn pro Gruppe, um eine Power von 1 − 𝛽 = .80 zu erreichen:
Die Power kann mit dem kostenlosen Programm G*Power3 für alle Designs berechnet werden (https://www.psychologie.hhu.de/arbeitsgruppen/allgemeine-psychologie-und-arbeitspsychologie/gpower.html)
Voraussetzungen und Annahmen (3+1+1)
• Statistische Voraussetzungen der MANOVA
– Unabhängige Messungen
– Gleiche Varianz-Kovarianzmatrizen über die AVn für alle Gruppen
– Multivariate Normalverteilung der AVn
• Zusätzliche Voraussetzung der MANCOVA
– Homogene Regressionskoeffizienten
• Außerdem berücksichtigen
– Linearität
– Multikollinearität
– Ausreißer
Unabhängigkeit der Messungen (3)
• Die Messungen der AV müssen unabhängig voneinander sein
• Mögliche Einschränkungen
– Externe (Stör-)Einflüsse während der Messung in einer Gruppe beeinflusst alle Mitglieder dieser Gruppe
– Zeiteffekte: Erfahrungen über ein Experiment sprechen sich herum
• Gegenmaßnahmen
– Konstante Bedingungen für alle Probanden
– Berücksichtigung externer Einflüsse als Faktor/Kovariate
– Strengeres Alpha-Niveau (𝛼 = .01)
Gleiche Varianz-Kovarianzmatrizen (3)
• Die Varianz-Kovarianzmatrix der AVn darf sich nicht substantiell zwischen den Gruppen unterscheiden
• Beispiel für eine Kovarianzmatrix bei 4 AVn:
• Statistische Prüfung: Box‘s M-Test (Box, 1949)
• Box‘s M Test in R: biotools::boxM(…)
• Bei Verletzung der Varianz-Kovarianz-Homogenität
– Geringer Einfluss bei homogenen Gruppengrößen:
– Ggf: Entfernen von Ausreißern oder Reduktion der Schiefe
durch Transformation der AVn
Voraussetzung & Test: Normalverteilung (NV) (2)
• Strenge Voraussetzung: Multivariate Normalverteilung der AVn
– Alle möglichen Linearkombinationen der AVn müssen normalverteilt sein
– Prüfung der Multivariaten Normalverteilung: Henze-Zirkler's Test (Henze & Zirkler, 1990)
– Prüfen in R: MVN::mvn(…, mvnTest='hz')
• Verletzungen der NV Annahme
– Ggf. Transformation der AVn
– Geringer Einfluss auf das Testergebnis bei großem N
– Verletzung der NV Annahme kann das Ergebnis des Box‘s M-Test beeinflussen
Signifikanztest der MANOVA (4)
• Roy‘s Greatest Characteristic Root
– Es wird nur ein Composite der AVn berücksichtigt
– Gut geeignet für eindimensionale Daten (ein starker Faktor)
– Hohe Power, aber anfällig bei Verletzung der Voraussetzungen
• Wilk‘s Lambda
– Es werden 𝑝 − 1 (unabhängige) Composites gebildet
– Mittlere Power, robuster gegenüber Verletzungen einzelner Voraussetzungen
• Pillai‘s Criterion
– Geringe Power aber sehr robust, wenn Voraussetzungen verletzt sind
• Hotelling‘s Spur
• Bei 𝑝 = 2 Gruppen sind alle Kriterien identisch!
Interpretation der Ergebnisse (3)
Interpretation der Ergebnisse
• Haupteffekte aller Faktoren
• Interaktionseffekte
• Bei signifikanten multivariaten Ergebnissen bliebt unklar, welche AVn zu
den Gruppenunterschieden beitragen
– Post-Hoc: Univariate Tests
– Oder: Schrittweise Aufnahme der AVn, solange sich die aufgeklärte Varianz
erhöht
Anwendungsbeispiel: Studieninteressen
• Forschungsfrage: Unterscheiden sich die Studieninteressen von OBAC vs. DCP
Studierenden?
• UV: Studienschwerpunkt (OBAC vs. DCP)
• AVn: Interesse für 14 Studiengebiete (Rating: 0 bis 6)
(1) Psychische Störungen und ihre Ursachen
(2) Gruppenprozesse
(3) Denken und Kognition
(4) Datenauswertung und Statistik
(5) Personalauswahl und -entwicklung
(6) Motivation und Emotion
(7) Entwicklung über die Lebensspanne
(8) Biologische Grundlagen des Verhaltens
(9) Beratung und Coaching
(10) Schulpsychologie
(11) Mathematische Modellierung psychologischer Prozesse
(12) Psychologische Diagnostik
(13) Gesundheit und Prävention
(14) Umweltpsychologie
Datascreening (1): Fehlende Daten und Wertebereiche
Datascreening (2): Gruppengrößen
Datascreening (3): Multivariate Ausreißer
Datascreening (4): Multivariate Normalverteilung
Datascreening (5): Homogenität der Varianz-Kovarianz-Matrizen
Multivariate Analyse
Univariate Ergebnisse
Zusammenfassung ()
• Mit einer MANOVA werden die Mittelwerte mehrere AVn gleichzeitig zwischen verschiedenen Gruppen oder Messzeitpunkten verglichen
• Dazu werden die AVn zu einer / mehreren Linearkombinationen zusammengefasst
• Die Gewichte der Linearkombinationen(en) werden so gewählt, dass sich ein maximaler F-Wert ergibt
• Vorteil gegenüber mehreren ANOVAs: Eine Alpha-Fehler-Kumulierung wird vermieden
• Voraussetzungen
(1) Unabhängige Messungen
(2) Gleiche Varianz-Kovarianzmatrizen für alle Gruppen
(3) Multivariate Normalverteilung
• Signifikanztests
(1) Roy‘s Greatest Characteristic Root (hohe Power, wenig robust)
(2) Wilk‘s Lambda (mittlere Power)
(3) Pillai‘s Criterion (geringe Power, sehr robust)
(4) Hotelling‘s Spur (geringe Power, sehr robust)
Zuletzt geändertvor 2 Jahren