Faktoranalyse
Idee
Ziele
Gruppe von Items auf eine kleinere Anzahl von Variablen (Faktor) verringern
Datenreduktion
Vielzahl von Iteams durch eine geringere Anzahl von Faktoren darstellen, ohne zu viel Information zu verlieren
Instrumentenentwicklung
Entwicklung neuer Mess-Skalen (Identifikation geeigneter Items)
Test/Validierung bestehender Messinstrumente
Das ist?
Ein Beispiel für eine Faktoranalyse
Exploratische (EFA) vs konfirmatische (CFA) Faktoranalyse
EFA
Verwendung: Ohne a-priori Hypothesen bzgl. der Faktoren
Exploration der Daten, um Anzahl, Bedeutung und Struktur der Faktoren zu ermitteln
=> nicht theoriegeleitet
CFA
Verwendung: mit a-priori Hypothesen bzgl. Anzahl, Bedeutung und Struktur der Faktoren
Möglichkeit, diese Hypothesen zu testen
=> Theoriegeleistetes, deduktives Vorgehen
Grundidee
Wann sinnvoll
Wann sinvoll:
Stichprobengröße: verschiedene Faustregeln
min. 10 Fälle pro Variable
min 300 Fälle insgesamt
Prüfkriterien
SPSS produziert immer eine Lösung -> Garbage in -> Garbage out
Ablauf einer EFA
Eignung der Daten
Ausgangspunkt: Korrelatinsmatrix der Variablen bzw Items
Faktorenextraktion
Bestimmung der Anzahl der relevanten Faktoren
Rotation der Faktorenstruktur
Interpretation der Faktoren
Hauptkomponentenanalyse (PCA)
Hauptachsenanalyse (PAF)
Hauptkomponentenanalyse (PCA) <- Fokus
Items werden auf eine kleinere Gruppe von Komponenten reduziert, ohne zu viel Information zu verlieren
Hauptkomponenten = gewichtete Summenidizes der Items
ist keine Faktoranalyse (Komponente =/= Faktor)
PCA ist Default in SPSS, in Managementforschung häufig angewandt
PCA ist leichter zu erklären als PAF, Prinzipien gelten äquivalent
Meist liefern PCA und EFA ägnliche Ergebnisse
Exploratische Faktoranalyse im eigentlichen Sinn
Unterstellt Kausalmodell, nach dem eine Untergruppe von Items durch einen Faktor (latente Variable) verursacht wird
Wichtige Kennwerte bei der Faktorenextraktion
Wie bestimmt man die relevante Anzahl von Faktoren?
zunächst werden solange Faktoren exrtahiert, bis die Gesamtvarianz erklärt ist
Anzahl Faktoren = Anzahl Items
Faktoren werden zunehmend unwichtiger (erklären immer weniger Varianz -> immer kleinere Eigenwerte)
Daher: Was sind die wichtigsten Faktoren, die die Gesamtvarianz hinreichend gut erklären?
welche Methoden zur Auswahl relevanter Faktoren gibt es?
Methoden zur Auswahl relevanter Faktoren
Kaiser Kriterium
Scree Test
Parallelanalyse
Unterschiedliche Kriterien können verschiedene Entscheidungen nahelegen -> subjektive Element
Wichtig: Klare und transparente Begründung der Entscheidung
Kaiser Kriterium (Kaiser Guttmann Kriterium / Eigenwertkriterium)
Probleme
Faktoren mit Eigenwert > 1 werden als bedeutsam angesehen und daher ausgewählt
Problem
Beurteilung hänft von der Anzahl der Items ab: Zahl der Faktoren wird bei steigender Itemzahl überschätzt
Es werden u.U. zu viele unwichtige Faktoren ausgewählt
Literatur rät von Verwendung dieses Kriteriums ab
Kaiser Kriterium ist Default in SPSS
graphische Darstellung der Eigenwerte aller Faktoren (schwarz)
Faktoren links neben Knick werden extrahiert
Lösung twl. nicht eindeutig
Erweiterung des Scree Tests
Eigenwerte zufälliger Items über die Abbildung legen (rot)
Auswahl der Faktoren oberhalb dieser Linie
Warum sollten Faktoren rotieren?
Vorige Schritte liefern potentiell relevante Faktoren
die meisten Items laden i.d.r. stark auf den ersten Faktor und schwach auf die anderen Faktoren
Oft laden einige Items relativ stark auf mehr als einen Faktor
Bedeutung der Faktoren ist schwer interpretierbar
Lösung
Rotation der Faktoren
Drehung der Faktoren im p-dimensionalen Raum, so dass die Items möglichst hoch auf einen Faktor laden und möglichst gering auf alle anderen
Zwei Arten: Orthogonal und Schiefwinklig/oblique
Orthogonale Rotation
unrotierte Faktoren korrelierten nicht
dies wird bei der orthogonalen Rotation beibehalten
bekannteste Methode: Varimax
Anwendung: Wenn man theoretisch von nicht-korrelierten Faktoren ausgeht
Problem: Annahme ist i.d.r. unsinnig
Oblique Rotation
lösst Korrelation zwischen den Faktoren zu -> Achsen dürfen Winkel verändern
Bekannteste methode: Oblimin
Anwendung: Wenn man theoretisch von zusammenhängenden Faktoren ausgeht
Praktische Entscheidung zwischen orthogonaler und obliquer Rotation:
Beide Rotationen durchführen
Korrelation der Faktoren beurteilen
vernachlässigbar -> orthogonal
substantiell -> oblique
Analyse der rotierten Faktoreinladungen
Welche Items laden hoch auf einen bestimmten Faktor? Verwenden
laden mache Items hoch auf mehrere Faktoren? Ausschließen
Gibt es Items, die auf keinen Faktor hoch laden? Ausschließen
Benennung der Faktoren
Faktoren sind zunächst rein statistische Konstrukte
Interpretation ist ein subjektiver Vorgang
Benennung auf Basis der inhaltlichen Bedeutung der Items mit den höchsten (rotierten) Faktorladungen
Limitation der EFA
rein exploratives Vorgehen -> kein Test von Theorien bzw Hypothesen möglich
Oft Unklarheit über die Anzahl der Faktoren
Messfehler (bei PCA) nicht berücksichtigt
kein eindeutige Evaluation, Interpretation hat stark subjektive Elemente
-> Konfirmatorische Faktoranalyse adressiert viele dieser Probleme
CFA (konfirmatorische Faktoranalyse)
Vorbemerkung
relativ komplexes Vorgehen zum deduktiven test einer vorgegebenen Faktorstruktur
nicht möglich in SPSS -> in R möglich
bei uns nur Skizzierung der Grundideen der CFA
Statistischer Test einer spezifizierten Faktorstruktur
Es wird a priori festgelegt
wie viele Faktoren es geben soll (latente Variablen)
welche Items (manifest Var.) auf welche Faktoren laden sollen
Messfehler werden explizit berücksichtigt
Wichtige Beurteilungskriterien eines CFA Modells
Wichtige Parameterschätzungen
eines CFA Modells
Weitere Möglichkeiten der CFA
Zuletzt geändertvor einem Jahr