Welche Aufgaben erfüllen Clusteranalysen?
Gruppierung von Objekten
Was ist der Unterschied einer Klassifizierung und der Clusteranalyse?
Bei einer Klassifiezierung wird ein Modell erstellt, wodurch sich neue Beobachtungen vorhersagen lassen können. Bei einer Clusteranalyse wird kein Modell generiert
Wie wird die Güte einer Clusteranalyse ermittelt?
Die Distanz von Objekten innerhalb eines Cluster sollte möglichst gering sein.
Die Distanz von Objekten zum Zentrum sollte recht hoch sein.
Welche Schritte zur Vorbereitungen werden für die erstellung eines Clusters benötigt.
Formulierung eines Untersuchungsziels
Aufbereitung Datenmaterial
=> Merkmale normieren und transformieren
Auswahl eines geeigneten Distanz Maßes
Welche Metrischen Distanzmaße gibt es?
Euklische Distanz
Manhattan Distanz
Chebychew Distanz
Welche Nominal Skalierten Distanzmaße gibt es?
Simple Matching
Russel an Rao
Was ist ein Zentroid?
Ist die Zentrale Koordinate aller Obejkte eines Clusters
Was bedeutet WSS und wie wird dies Interprtiert?
WSS = Within Sum of Squares
=> Beschreibt die Distanz aller Objekte eines Clusters zu seinem Zentroiden
Sollte möglichst gering sein
Was bedeutet BSS und wie wird dies Interprtiert?
BSS = Between Sum of Squares
=> Beschreibt die Distanz aller obejekte zum Zentrum aller Daten
Sollte möglichst hoch sein.
Welche 2 Arten von Methoden gibt es um Cluster zu erstellen?
Agglomerative Methoden => Jedes Objekt ist ein Cluster. Cluster werden immer mehr in größerern Clustern zusammengefasst
Diversive Methoden =>Fängt mit einem großen Cluster an, welches alle Objekte enthät. Wir dann immer weiter zerkleinert
Zu welcher Art gehört das Ward Verfahren?
Agglomeratives Verfahren
Welcher Wert wird für das Ward Verfahren verwendet?
Abstandsquadratsumme (AQS)
Wie ist die Vorgehensweise beim Ward Verfahren?
Berechnung der AQS aller Objekte
Zusammenfassung der Objekte mit dem geringsten AQS
=> Neue Korrdinate ist Mittelwert der Objekte
Wiederholung der schritte 1 - 2
Wie ist die Vorgehensweise beim k-Means Algorithmus?
Zufällige Positionierung einer Anzahl von k Zentroiden
Objekte werden dem nächsten Zentroiden zugeordnet
Zentroide werden in den Mittelpunkt aller ihm zugeordneten Objekte bewegt
Wiederholung der Schritte 2 + 3
Wie findet man die Anzahl an Zentroiden (k) heraus?
Der Algorithmus fügt mit jedem Durchgag einen neuen Zentroiden hinzu. Sobald der WSS oder TSS kleiner als 0.2 ist, wird die Anzahl an Clustern verwendet.
Last changed2 years ago