4.1 Problemstellung
= wenn große Datensätze analysiert werden sollen
Reduktion große Anzahl korrelierende Variable auf geringe Anzahl von Faktoren
Strukturierung Daten um Abhängigkeit zwischen korrelierenden Variablen zu erkennen
—> auf gemeinsame Ursachen (Faktoren) untersuchen + Konstrukt generieren
Annahme: Datensatz aus hoch korrelierenden AVs
Bilder
ausreichend Wechselbeziehung
ausreichend Wechselbeziehung zwischen Daten wichtig (vorher prüfen)
—> konzeptionelle Eignung = kausale Interpretation empirischer Korrelation unterstellt
—> Annahme: Korrelation durch dahinter stehende Variable F verursacht
Faktorladung
= Stärke Zuordnung durch Korrelationen zwischen ursprünglichen Variablen + Faktoren gemessen
Bsp.
Explorative versus konfimratorische Faktorenanalyse
—> EFA = entdecken von Strukturen in Datensatz
- Anwender keine Vorstellung, wie metrische Ausgangsvariablen zu Faktoren zsm.gefasst
- Anzahl extrahierende Faktoren unbekannt
—> KFA = Vorstellungen bekannt bzgl. Anzahl, Interpretation, Zuordnung Ausgangsvariable
4.2 Vorgehensweise
4.2.1 Eignung der Daten für eine Faktorenanalyse
Zusammenhänge Variablen = Korrelatioxsmatrix berechnen
—> Vereinfachung durch Standardisierung möglich
Interpretation Korrelationen zwischen 2 Faktoren als von dritten (nicht beobachteten) gemeinsamen abhängig
standardisierte Variablen = Varianz-Kovarianz-Matrix + Korrelatioxsmatrix identisch
Test Tests zur Feststellung, ob beobachtete Korrelation hoch genug ist:
Bartlett Test
(Test auf Sphärizität)
—> prüft Hypothese, dass Stichprobe aus GG stammt, wo Variablen unkorreliert
—> H0: Variablen in Erhebungsgesamtheit unkorreliert, H1: korreliert
—> unkorreliert = Korrelatioxsmatrix entspricht Einheits-/ Identitätsmatrix (R = I)
—> Voraussetzung: Variablen sind Normalverteilt
—> Prüfgröße: Chi-Quadrat
Kaiser-Meyer-Olkin (KMO) Kriterium
—> partielle Korrelation: Grad Abhängigkeit zwischen 2 Variablen (ohne anderen Einfluss)
—> eher klein = Variablen wahrscheinlich gemeinsame Varianz durch gem. Faktor
—> kleine partielle Korrelation = hohe Werte für KMO
Maß für Stichprobenadäquanz (MSA) und Kaiser-Meyer-Olkin-Kriterium
—> Eignung einzelner Variable für Faktorenanalyse
—> MSA = Werte zwischen 0 und 1 (möglichst nahe 1 liegen)
Anti-Image-Kovarianz-Matrix
—> Varianz in 2 Teile zerlegbar (Image und Anti-Image)
—> Image = Anteil Varianz, durch Variablen mit multiple Regressionsanalyse erklärbar
—> Anti-Image = von übrigen Variablen unabhängig
—> geeignete Variable = wenn Anti-Image nahe Null
—> partielle Kovarianzen zwischen 2 Variablen = für negative PK eher klein sein
—> AIKM = enthält partielle Kovarianzen zwischen Variablen + Anti-Image-Werte Variablen
4.2.2 Extraktion und Anzahl der Faktoren
Grafische Verdeutlichung von Korrelationen
Korrelationen in Vektordiagramm abbilden (Korrelation Winkeln zwischen 2 Vektoren)
—> 2 Vektoren = linear unabhängig (unkorrliert), wenn orthogonal (90 Grad) zueinander
Bestimmung Faktoren (Achsen) in Position zu Vektoren
Das Fundamentaltheorem
Annahme: jeder Beobachtungswert einer standardisierten Variable j bei Person n als Linearkombi aus mehreren (nicht beobachteten) Faktoren darstellbar
Faktorladung a = wie stark Faktor mit anfänglicher Variable zusammenhängt —> Maß Beziehung Variablen und Faktor
Fundamentaltheorem = Beziehung
Grafische Verdeutlichung der Faktorenextraktion
Faktorladung = Modellparameter des faktoranalytischen Modells
durch Standardisierung Ausgangsvariable MW von 0 und SA von 1
Varianz der standardisierten Variablen stehen auf Hauptdiagonale der Korrelatioxsmatrix + entsprechen Korrelation einer Variablen
Können Faktoren Varianz vollständig reproduzieren, ist Summe quadrierte Faktorladung 1
Mathematische Verfahren zur Extraktion von Faktoren
Reduktion große Anzahl korrelierte Variablen auf geringe Anzahl an Faktoren
Aufdeckung Ursachen (Faktoren), die hinter Korrelation zwischen Variablen stehen
für 1: Hauptkomponentenanalyse (HKA)
—> nach kleiner Anzahl von Faktoren gesucht, die max. Varianz (Info) reproduzieren
—> Ziel: Datenreduktion
für 2: Faktoranalyse (FA)
—> Faktoren als Ursache der beobachteten Variablen und Korrelationen interpretiert
—> Annahme: Faktoren erklären nicht gesamte Varianz der Variablen
—> zum Auffinden und Untersuchung von Hypothesen
HKA von FA unabhängiges Verfahren, unterschiedliche theoretische Modelle
—> beide aber gleiche Schritte, verwendeten iterative Algorithmen zur Lösung
Hauptkomponentenanalyse
großen Teil Varianz in Datensatz mit nur 1/ wenigen Hauptkomponenten reproduzieren
Kommunalität = Maß für Varianz (Info) einer Variable j, durch Hauptkomponenten erklärt —> wie viel Varianz (Info) einer Variable durch extrahierte Hauptkomponente erklärt
Summe quadrierte Ladungen über Variablen ergibt Eigenwert Hauptkomponente q
—> als Maß für die in Faktor erhaltene Infos interpretiert werden
veranschaulichen in Screeplot (Liniendiagramm der Eigenwerte über Anzahl extrahierte Hauptkomponenten/ Faktoren
Ziel HKA: Entdeckung geringe Anzahl von Komponenten + Erhaltung Maximum an Info
Hauptkomponentenanalyse: Ziel
große Anzahl von Variablen durch kleine Anzahl Hauptvariablen repräsentieren,
die unkorreliert sind, keine redundanten Infos enthalten,
Maximum an Infos bewahren
Faktoranalytischer Ansatz
Ursache (Faktoren) der beobachteten Variablen + Korrelation aufdecken
FA = Kommunität einer Variable nie 1, sondern immer kleiner 1
—> auch wenn alle Faktoren extrahiert
Kommunalitätsproblem = Kommunität erst nach Extraktion der Faktoren bekannt
Bestimmung anfängliche Kommunität = multiple quadrierte Korrelationseffiziente jeder beobachteten Variable j in Bezug auf andere Variable
Faktoranalytischer Ansatz: Extraktionsmethode der Faktorenanalyse
—> Hauptachsenanalyse (HAA) = Grundverfahren für Faktorenanalyse
- extrahiert Faktorladungen auf empirischen Korrelationsmatrix
- Schätzung der Kommunität der Variablen
nachfolgend gebräuchliche Extraktionsverfahren der Faktorenanalyse
Anzahl der Faktoren
aus Vorstellung Anwender abgeleitet werden, wie viel Einheitsvarianz erklärt werden soll
oder Anwender kennt Anzahl extragierende Faktoren
keine Vorstellung zur Zahl = Hilfskriterien zur Entscheidungsfindung:
Betrachtung der anfänglichen Eigenwerte im Ausgangspunkt
Eigenwert oder Kaiser Kriterium
Scree-Test = greift anfängliche Eigenwerte auf (Knick, Ellbogen) —> Faktoren mit kleinsten Eigenwerten als Geröllhalde (ungeeignet) betrachtet
Beurteilung der Güte einer Faktorenlösung
extrahierte Faktoren = keine Aussage, wie viel Varianz durch gewählte Faktorenlösung erklärt
4.2.3 Faktoren-Interpretation
Beurteilung durch Differenzen zwischen empirischen und reproduzierten Korrelationen
—> Residuen sollten immer < 0,5 sein
Mehrfachladung = Interpretation schwer, wenn nicht klar auf welchem Faktor Variable lädt
—> absolute Wert der Faktorladung sollte > 0,5 sein, um relevant zu sein
Rotation = wenn Zuordnung nicht eindeutig, verbesserte Interpretation durch Rotation
1. Annahme: Faktoren korrelieren nicht, Vektoren bleiben in rechten Winkel zueinander
—> VARIMAX-Rotation am bekanntesten
2. Korrelation angenommen = Vektoren in schiefen Winkel zueinander rotiert
—> oblique (schiefwinklige) Rotation
4.2.4 Bestimmung der Faktorwerte
Surrogate
= einfache Methode, höchste Ladung einer Variablen als Ersatz für Faktor angenommen
—> nur akzeptable, wenn höchste Laufend dominanter Wert
—> alle anderen Ladungen dramatisch niedriger
summierte Skalen
= Alternative zu Surrogate, nutzen mehr Infos
—> kombinieren Variablen, die selbes Konzept messen
—> MW jedes Faktors gebildet
—> Basis: Mehrfachladungen
Regressionsanalyse
= Matrix des RK multipliziert erhält man Matrix der Faktorwerte P
—> Interpretation Faktorwerte = achten, dass Standardisierte Werte enthalten
—> negativer Faktor = Objekt in Bezug auf Faktor im Vergleich unterdurchschnittlich
—> Faktor bei 0 = Objekt entspricht Durchschnitt
—> positiver Faktor = Objekt in Bezug auf Faktor im Vergleich überdurchschnittlich
4.4 Erweiterung: Konfirmatorische Faktorenanalyse (KFA)
EFA
Ziel EFA: Variablen finden, die hoch korreliert sind und Faktoren kombinieren
—> keine a priori Beziehung zwischen Variablen
—> um Daten zu erforschen und nach Struktur in Satz von Variablen zu suchen
—> um Anzahl der Variablen zu reduzieren
KFA
vorgegebene, hypothetische Konstrukte durch empirisch erhobene Variablen messen
—> zur Prüfung, ob Faktor in empirisch gemessene Variable widerspiegelt
—> Instrument zur Operationalisierung hypothetischer Konstrukte (latente Variable)
1. Anzahl Faktoren (betrachtete Konstrukte)
2. Inhaltliche Benennung Faktoren
3. Findung und Zuordnung Messvariablen, die Konstrukt in Gesamtheit widerspiegelt
Vergleich EFA und KFA
4.5 Anwendungsempfehlungen
Zuletzt geändertvor 2 Jahren