Ward mit anschließender k-Means-Analyse
Verfasst: Do 4. Aug 2016, 17:41
Hallo zusammen,
ich bin neu hier und freue mich darauf mit euch zusammen ein paar der Fragen der Statistik zu klären.
Da ich aktuell an einer Clusteranalyse arbeite, mir aber über den weiteren Weg und einige Details unsicher bin, versuche ich meine Fragen in diesem Forum zu klären.
Mein Datensatz besteht aus 68 Fällen (N) die durch 19 Variablen mehr oder weniger beschrieben werden. In einem ersten Schritt habe ich eine PCA durchgeführt, die die Anzahl meiner Variablen von anfangs über 40 auf 19 verringert hat. Nun stehe ich vor der Aufgabe meine 68 Fälle in Cluster einzuteilen, um ihre Abstammung genauer zu bestimmen.
Hierfür habe ich mittels einer Ward-Analyse eine erste Idee für eine Clusterung (4 bzw. 5-Cluster Lösung) bekommen. Um diese Clusterung zu optimieren ist die Durchführung einer k-Means-Analyse geplant. Nun zu meinen Fragen:
(0.) Ist dieses Vorgehen sinnvoll?
1. Kann ich aus den SPSS Ergebnissen der Wardanalyse irgendwie die bisherigen Clusterzentren (für k-means) entnehmen, wenn ja wie?
2. Wenn nein, wie sieht das beste Vorgehen zur Bestimmung von Clusterzentren aus? Leider finde ich die an SPSS angelehnte Literatur hierzu eher bescheiden.
Beste Grüße
ich bin neu hier und freue mich darauf mit euch zusammen ein paar der Fragen der Statistik zu klären.
Da ich aktuell an einer Clusteranalyse arbeite, mir aber über den weiteren Weg und einige Details unsicher bin, versuche ich meine Fragen in diesem Forum zu klären.
Mein Datensatz besteht aus 68 Fällen (N) die durch 19 Variablen mehr oder weniger beschrieben werden. In einem ersten Schritt habe ich eine PCA durchgeführt, die die Anzahl meiner Variablen von anfangs über 40 auf 19 verringert hat. Nun stehe ich vor der Aufgabe meine 68 Fälle in Cluster einzuteilen, um ihre Abstammung genauer zu bestimmen.
Hierfür habe ich mittels einer Ward-Analyse eine erste Idee für eine Clusterung (4 bzw. 5-Cluster Lösung) bekommen. Um diese Clusterung zu optimieren ist die Durchführung einer k-Means-Analyse geplant. Nun zu meinen Fragen:
(0.) Ist dieses Vorgehen sinnvoll?
1. Kann ich aus den SPSS Ergebnissen der Wardanalyse irgendwie die bisherigen Clusterzentren (für k-means) entnehmen, wenn ja wie?
2. Wenn nein, wie sieht das beste Vorgehen zur Bestimmung von Clusterzentren aus? Leider finde ich die an SPSS angelehnte Literatur hierzu eher bescheiden.
Beste Grüße