Variance Ratio Criterion von Calinski & Harabasz

Alles rund um Clusteranalysen.

Variance Ratio Criterion von Calinski & Harabasz

Beitragvon Schaumgummiball » Di 18. Okt 2011, 11:53

Hallo zusammen,

ich habe eine Frage zu meiner Clusteranzahl, die gegebenenfalls ziemlich trivial ist, aber da ich kein besonderes Mathe-Genie bin, erschließt sich mir die Antwort nicht direkt und ich finde auch online keine Lösung.
Ich habe eine Clusteranalyse mit insgesamt 6 Variablen durchgeführt. Um zu berechnen, welche Anzahl an Clustern in meinen Daten vorhanden sind, habe ich das VRC von Calinski und Harabasz angewendet. Ich mich vor allem an dieser Anleitung orientiert: http://www.guide-market-research.com/L3 ... terion.pdf
Mithilfe der k-Means-Methode habe ich in SPSS ANOVAs für k = 2 bis k = 7 Cluster durchgeführt, und habe für jedes k jeweils das VRCk berechnet, indem ich die F-Werte aller ins Cluster eingegangenen Variablen summiert habe. Dann habe ich für jedes k nach der folgenden Formel jeweils einen Wert ωk berechnet:
ωk = (VRCk+1 - VRCk) – (VRCk – VRCk-1)

Die Clusterlösung, welche den niedrigsten Wert ωk besitzt, ist demnach die "beste" Lösung. Nun ist dieser Wert allerdings bei einer Lösung negativ, der Betrag dieser Lösung ist allerdings größer als bei einer anderen Lösung, deren Wert allerdings positiv ist. Nun bin ich mir nicht sicher, wie ich damit umgehen soll - ist der negative Wert meine kleinste Lösung? Oder wird nur der Betrag gewertet?

Für eine Antwort wäre ich seeeehr dankbar!

Viele Grüße
Schaumi
Schaumgummiball
Beobachter
Beobachter
 
Beiträge: 18
Registriert: Di 18. Okt 2011, 11:35
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Zurück zu Clusteranalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast