Buffl

Statistik Set

EG
by Emilia G.

Wozu benötige ich eine Hauptkomponentenanalyse?

Hauptkomponentenanalyse (PCA) dient zur Datenreduktion

Ziel: Zusammenhänge zw. vielen Variablen durch wenige Hauptkomponenten (HK) darzustellen, d.h. Einfache Beschreibung der Beobachtungen durch wenige Variablen(ohne viel Information zu verlieren)

PCA ist hypothesengenerierend, exploratorisch

PCA besteht aus drei Schritten:

  1. Extraktion

    • Varianz der beobachteten Variablen 𝑍𝑖 durchebenso viele HK 𝐻𝑗 erklärt

    • jede Variable eine Linearkombination der HK

    • 𝜆𝑖𝑗 (lambda) = Beitrag der HK𝑗 zur Variable𝑖

    • 𝜆𝑖𝑗² = erklärte Varianz in Item i durch HKjZiele der Zerlegung: Zerlegung der enthaltenen Infos +Minimierung der Redundanz

  2. Reduktion

    • Eigenwerte in einem Screeplot darstellen

    • Ziel = Datenreduktion, daher nur die wichtigsten HKsauswählen, andere verwerfen

    • Reduktion nach Kaiser Guttmann Kriterium: alle HKsbehalten, deren Wert höher als 1 (mehr Varianz alseigene Variable aufklären)

    • Reduktion d. Parallelanalyse nach Horn: zufällige Datenmit gleicher n + Variablenanzahl erzeugt

    • nur HKs mit Eigenwert über diesen Daten behalten

    • Auswirkung d. Reduktion: Kommunalität sinkt, abersparsameres Modell (HKs werden aufsummiert)

    • Interpretation: Wie viel Varianz wird durch Item erklärt(z.B. Item Kommunalität v. .555 = 55.5%)

  3. Rotation

    • PCA überlegt, wie man Modell drehen muss, damitmeisten Infos abgebildet sind

    • Rotation erhöht Interpretierbarkeit

    • Ziel: möglichst einfache Struktur der Ladung zu findenEigenschaften nach Rotation:

      • Summe der quadrierten Faktorladung pro Item(Kommunalität) bleibt gleich

      • Eigenwert ändert sich

Author

Emilia G.

Information

Last changed