4. Faktoranalyse – Buffl

Buffl

MVAV - Statistik

DT

by Desi T.

4.1 Problemstellung

= wenn große Datensätze analysiert werden sollen

Reduktion große Anzahl korrelierende Variable auf geringe Anzahl von Faktoren
Strukturierung Daten um Abhängigkeit zwischen korrelierenden Variablen zu erkennen
—> auf gemeinsame Ursachen (Faktoren) untersuchen + Konstrukt generieren

Annahme: Datensatz aus hoch korrelierenden AVs

4.1 Problemstellung

Bilder

4.1 Problemstellung

ausreichend Wechselbeziehung

ausreichend Wechselbeziehung zwischen Daten wichtig (vorher prüfen)
—> konzeptionelle Eignung = kausale Interpretation empirischer Korrelation unterstellt
—> Annahme: Korrelation durch dahinter stehende Variable F verursacht

4.1 Problemstellung

Faktorladung

= Stärke Zuordnung durch Korrelationen zwischen ursprünglichen Variablen + Faktoren gemessen

4.1 Problemstellung

Bsp.

4.1 Problemstellung

Explorative versus konfimratorische Faktorenanalyse

—> EFA = entdecken von Strukturen in Datensatz
- Anwender keine Vorstellung, wie metrische Ausgangsvariablen zu Faktoren zsm.gefasst
- Anzahl extrahierende Faktoren unbekannt
—> KFA = Vorstellungen bekannt bzgl. Anzahl, Interpretation, Zuordnung Ausgangsvariable

4.2 Vorgehensweise

4.2 Vorgehensweise

4.2.1 Eignung der Daten für eine Faktorenanalyse

Zusammenhänge Variablen = Korrelatioxsmatrix berechnen
—> Vereinfachung durch Standardisierung möglich
Interpretation Korrelationen zwischen 2 Faktoren als von dritten (nicht beobachteten) gemeinsamen abhängig
standardisierte Variablen = Varianz-Kovarianz-Matrix + Korrelatioxsmatrix identisch

4.2 Vorgehensweise

4.2.1 Eignung der Daten für eine Faktorenanalyse

Test Tests zur Feststellung, ob beobachtete Korrelation hoch genug ist:

4.2 Vorgehensweise

4.2.1 Eignung der Daten für eine Faktorenanalyse

Bartlett Test

(Test auf Sphärizität)
—> prüft Hypothese, dass Stichprobe aus GG stammt, wo Variablen unkorreliert
—> H0: Variablen in Erhebungsgesamtheit unkorreliert, H1: korreliert
—> unkorreliert = Korrelatioxsmatrix entspricht Einheits-/ Identitätsmatrix (R = I)
—> Voraussetzung: Variablen sind Normalverteilt
—> Prüfgröße: Chi-Quadrat

4.2 Vorgehensweise

4.2.1 Eignung der Daten für eine Faktorenanalyse

Kaiser-Meyer-Olkin (KMO) Kriterium

—> partielle Korrelation: Grad Abhängigkeit zwischen 2 Variablen (ohne anderen Einfluss)
—> eher klein = Variablen wahrscheinlich gemeinsame Varianz durch gem. Faktor
—> kleine partielle Korrelation = hohe Werte für KMO

4.2 Vorgehensweise

4.2.1 Eignung der Daten für eine Faktorenanalyse

Maß für Stichprobenadäquanz (MSA) und Kaiser-Meyer-Olkin-Kriterium

—> Eignung einzelner Variable für Faktorenanalyse
—> MSA = Werte zwischen 0 und 1 (möglichst nahe 1 liegen)

4.2 Vorgehensweise

4.2.1 Eignung der Daten für eine Faktorenanalyse

Anti-Image-Kovarianz-Matrix

—> Varianz in 2 Teile zerlegbar (Image und Anti-Image)
—> Image = Anteil Varianz, durch Variablen mit multiple Regressionsanalyse erklärbar
—> Anti-Image = von übrigen Variablen unabhängig
—> geeignete Variable = wenn Anti-Image nahe Null
—> partielle Kovarianzen zwischen 2 Variablen = für negative PK eher klein sein
—> AIKM = enthält partielle Kovarianzen zwischen Variablen + Anti-Image-Werte Variablen

4.2 Vorgehensweise

4.2.2 Extraktion und Anzahl der Faktoren

Grafische Verdeutlichung von Korrelationen

Korrelationen in Vektordiagramm abbilden (Korrelation Winkeln zwischen 2 Vektoren)
—> 2 Vektoren = linear unabhängig (unkorrliert), wenn orthogonal (90 Grad) zueinander
Bestimmung Faktoren (Achsen) in Position zu Vektoren

4.2 Vorgehensweise

4.2.2 Extraktion und Anzahl der Faktoren

Das Fundamentaltheorem

Annahme: jeder Beobachtungswert einer standardisierten Variable j bei Person n als Linearkombi aus mehreren (nicht beobachteten) Faktoren darstellbar
Faktorladung a = wie stark Faktor mit anfänglicher Variable zusammenhängt —> Maß Beziehung Variablen und Faktor
Fundamentaltheorem = Beziehung

4.2 Vorgehensweise

4.2.2 Extraktion und Anzahl der Faktoren

Grafische Verdeutlichung der Faktorenextraktion

Faktorladung = Modellparameter des faktoranalytischen Modells
durch Standardisierung Ausgangsvariable MW von 0 und SA von 1
Varianz der standardisierten Variablen stehen auf Hauptdiagonale der Korrelatioxsmatrix + entsprechen Korrelation einer Variablen
Können Faktoren Varianz vollständig reproduzieren, ist Summe quadrierte Faktorladung 1

4.2 Vorgehensweise

4.2.2 Extraktion und Anzahl der Faktoren

Mathematische Verfahren zur Extraktion von Faktoren

Reduktion große Anzahl korrelierte Variablen auf geringe Anzahl an Faktoren
Aufdeckung Ursachen (Faktoren), die hinter Korrelation zwischen Variablen stehen

für 1: Hauptkomponentenanalyse (HKA)
—> nach kleiner Anzahl von Faktoren gesucht, die max. Varianz (Info) reproduzieren
—> Ziel: Datenreduktion
für 2: Faktoranalyse (FA)
—> Faktoren als Ursache der beobachteten Variablen und Korrelationen interpretiert
—> Annahme: Faktoren erklären nicht gesamte Varianz der Variablen
—> zum Auffinden und Untersuchung von Hypothesen
HKA von FA unabhängiges Verfahren, unterschiedliche theoretische Modelle
—> beide aber gleiche Schritte, verwendeten iterative Algorithmen zur Lösung

4.2 Vorgehensweise

4.2.2 Extraktion und Anzahl der Faktoren

Hauptkomponentenanalyse

großen Teil Varianz in Datensatz mit nur 1/ wenigen Hauptkomponenten reproduzieren
Kommunalität = Maß für Varianz (Info) einer Variable j, durch Hauptkomponenten erklärt —> wie viel Varianz (Info) einer Variable durch extrahierte Hauptkomponente erklärt
Summe quadrierte Ladungen über Variablen ergibt Eigenwert Hauptkomponente q
—> als Maß für die in Faktor erhaltene Infos interpretiert werden
veranschaulichen in Screeplot (Liniendiagramm der Eigenwerte über Anzahl extrahierte Hauptkomponenten/ Faktoren
Ziel HKA: Entdeckung geringe Anzahl von Komponenten + Erhaltung Maximum an Info

4.2 Vorgehensweise

4.2.2 Extraktion und Anzahl der Faktoren

Hauptkomponentenanalyse: Ziel

große Anzahl von Variablen durch kleine Anzahl Hauptvariablen repräsentieren,
die unkorreliert sind, keine redundanten Infos enthalten,
Maximum an Infos bewahren

4.2 Vorgehensweise

4.2.2 Extraktion und Anzahl der Faktoren

Faktoranalytischer Ansatz

Ursache (Faktoren) der beobachteten Variablen + Korrelation aufdecken
FA = Kommunität einer Variable nie 1, sondern immer kleiner 1
—> auch wenn alle Faktoren extrahiert
Kommunalitätsproblem = Kommunität erst nach Extraktion der Faktoren bekannt
Bestimmung anfängliche Kommunität = multiple quadrierte Korrelationseffiziente jeder beobachteten Variable j in Bezug auf andere Variable

4.2 Vorgehensweise

4.2.2 Extraktion und Anzahl der Faktoren

Faktoranalytischer Ansatz: Extraktionsmethode der Faktorenanalyse

—> Hauptachsenanalyse (HAA) = Grundverfahren für Faktorenanalyse
- extrahiert Faktorladungen auf empirischen Korrelationsmatrix
- Schätzung der Kommunität der Variablen
nachfolgend gebräuchliche Extraktionsverfahren der Faktorenanalyse

4.2 Vorgehensweise

4.2.2 Extraktion und Anzahl der Faktoren

Faktoranalytischer Ansatz

4.2 Vorgehensweise

4.2.2 Extraktion und Anzahl der Faktoren

Faktoranalytischer Ansatz

4.2 Vorgehensweise

4.2.2 Extraktion und Anzahl der Faktoren

Faktoranalytischer Ansatz

4.2 Vorgehensweise

4.2.2 Extraktion und Anzahl der Faktoren

Anzahl der Faktoren

aus Vorstellung Anwender abgeleitet werden, wie viel Einheitsvarianz erklärt werden soll
oder Anwender kennt Anzahl extragierende Faktoren
keine Vorstellung zur Zahl = Hilfskriterien zur Entscheidungsfindung:

Betrachtung der anfänglichen Eigenwerte im Ausgangspunkt
Eigenwert oder Kaiser Kriterium
Scree-Test = greift anfängliche Eigenwerte auf (Knick, Ellbogen) —> Faktoren mit kleinsten Eigenwerten als Geröllhalde (ungeeignet) betrachtet

4.2 Vorgehensweise

4.2.2 Extraktion und Anzahl der Faktoren

Beurteilung der Güte einer Faktorenlösung

extrahierte Faktoren = keine Aussage, wie viel Varianz durch gewählte Faktorenlösung erklärt

4.2 Vorgehensweise

4.2.3 Faktoren-Interpretation

Beurteilung durch Differenzen zwischen empirischen und reproduzierten Korrelationen
—> Residuen sollten immer < 0,5 sein
Mehrfachladung = Interpretation schwer, wenn nicht klar auf welchem Faktor Variable lädt
—> absolute Wert der Faktorladung sollte > 0,5 sein, um relevant zu sein
Rotation = wenn Zuordnung nicht eindeutig, verbesserte Interpretation durch Rotation
1. Annahme: Faktoren korrelieren nicht, Vektoren bleiben in rechten Winkel zueinander
—> VARIMAX-Rotation am bekanntesten
2. Korrelation angenommen = Vektoren in schiefen Winkel zueinander rotiert
—> oblique (schiefwinklige) Rotation

4.2 Vorgehensweise

4.2.4 Bestimmung der Faktorwerte

Surrogate

= einfache Methode, höchste Ladung einer Variablen als Ersatz für Faktor angenommen
—> nur akzeptable, wenn höchste Laufend dominanter Wert
—> alle anderen Ladungen dramatisch niedriger

4.2 Vorgehensweise

4.2.4 Bestimmung der Faktorwerte

summierte Skalen

= Alternative zu Surrogate, nutzen mehr Infos
—> kombinieren Variablen, die selbes Konzept messen
—> MW jedes Faktors gebildet
—> Basis: Mehrfachladungen

4.2 Vorgehensweise

4.2.4 Bestimmung der Faktorwerte

Regressionsanalyse

= Matrix des RK multipliziert erhält man Matrix der Faktorwerte P
—> Interpretation Faktorwerte = achten, dass Standardisierte Werte enthalten
—> negativer Faktor = Objekt in Bezug auf Faktor im Vergleich unterdurchschnittlich
—> Faktor bei 0 = Objekt entspricht Durchschnitt
—> positiver Faktor = Objekt in Bezug auf Faktor im Vergleich überdurchschnittlich

4.4 Erweiterung: Konfirmatorische Faktorenanalyse (KFA)

EFA

Ziel EFA: Variablen finden, die hoch korreliert sind und Faktoren kombinieren
—> keine a priori Beziehung zwischen Variablen
—> um Daten zu erforschen und nach Struktur in Satz von Variablen zu suchen
—> um Anzahl der Variablen zu reduzieren

4.4 Erweiterung: Konfirmatorische Faktorenanalyse (KFA)

KFA

vorgegebene, hypothetische Konstrukte durch empirisch erhobene Variablen messen
—> zur Prüfung, ob Faktor in empirisch gemessene Variable widerspiegelt
—> Instrument zur Operationalisierung hypothetischer Konstrukte (latente Variable)
1. Anzahl Faktoren (betrachtete Konstrukte)
2. Inhaltliche Benennung Faktoren
3. Findung und Zuordnung Messvariablen, die Konstrukt in Gesamtheit widerspiegelt

4.4 Erweiterung: Konfirmatorische Faktorenanalyse (KFA)

Vergleich EFA und KFA

4.5 Anwendungsempfehlungen

Author

Desi T.

Information

Last changed
2 years ago

© 2023 Buffl GmbH