Buffl

Clusteranalyse

JS
by Jonas S.

Non-Hierarchische Gruppierungsprozeduren (3)

• Zunächst wird die Anzahl der Cluster festgelegt

• Anschließend werden für alle Cluster jeweils für alle Variablen Anfangswerte (seeds) festgelegt

– Festlegung durch den Anwender (theoretische Erwartungen)

– Generierung aus der Stichprobe

—>Für 𝐾 Cluster werden die Werte von 𝐾 zufällig ausgewählten Probanden als Startwerte verwendet

– Bestimmung aus der Lösung einer hierarchischen Clusteranalyse

—>Zentroide der gefundenen Cluster

• Die Anfangswerte haben Einfluss auf die endgültige Lösung

—>ggf. mit mehrmals mit unterschiedlichen Startwerten berechnen

• Dann werden alle Fälle anhand der seed-Werte den Clustern zugeordnet

Sequential Threshold Methode

– Alle Elemente, deren Distanz zu den seed-Werten eines Clusters unterhalb einer festgelegten Schwelle liegt (z.B. 𝐷 < 1), werden diesem Cluster zugeordnet

– Das Clusterzentrum wird aus den nun zugeordneten Fällen neu berechnet

– Die Schwelle für die Zuordnung wird so lange schrittweise erhöht, bis alle Fälle einem der Cluster zugeordnet wurden

Parallel Threshold Methode

– Alle Elemente werden in einem Schritt dem Cluster zugeordnet, zu dessen Startwerten sie die geringste Distanz aufweisen

• Es folgt eine Optimierungsphase

• Da sich die Clusterzentren durch die Zuordnung verschieben, ist für manche Fälle die Distanz zum eigenen Clusterzentrum größer als zu einem anderen Clusterzentrum

• In einer iterativen Prozedur werden so lange Fälle in das passendere Cluster verschoben, bis keine weiteren Optimierungen möglich sind

• Durch die Optimierung steigt die Cluster-Homogenität

Author

Jonas S.

Information

Last changed