Seite 2 von 2

Re: Hierarchische Clusteranalyse auf Prozentverteilung

BeitragVerfasst: So 7. Aug 2016, 20:47
von Institut_Zwei
Obidamn hat geschrieben:Hallo Institut Zwei,
habe gar nicht mehr mit weiterer Hilfe gerechnet, daher erst jetzt Reaktion. Vielen Dank, das freut mich sehr!
Mich verunsichert eine Warnmeldung in SPSS bei Durchfühurng einer hierarchischen CA: "Das quadrierte euklidische Distanzmaß sollte verwendet werden, wenn die Cluster-Methoden CENTROID, MEDIAN oder WARD gewünscht sind."
Hierauf brauche ich eine Antwort, bzw. umgekehrt muss ich wissen, warum ich Ward nicht in Verbindung mit dem Chi2 Maß wählen sollte. In der Diskussion unten sind wir ein wenig Richtung Abstandsmaße abgedriftet, daher ist das Problem noch nicht gelöst...


Ich habe mit Ihnen auch nicht mehr gerechnet :)

Ich kann ihnen sagen, warum diese Meldung kommt. Weil die SPSS (aber nicht nur SPSS) Softwareentwickler die Centroid, Median und Wardmethode NUR an die Euklidische Distanz anbinden. Theoretisch könnte man auch andere Distanzen, Quasidistanzen, Metriken, Halbmetriken, Pseudometriken verwenden. Aber dies wären keine ethabilierten Methoden und zumal müsste ein neues abgekürztes Algorythmus zur Berechnung der Clusterung matheamtisch entwickelt werden. Ohne diesen würde die Berechung viel viel länger dauern, als "ethabiliert". Somit stünde SPSS vor einem Problem - setzt sie nur die "meistverkaufte" Methode um - oder auch andere und vielleicht nur langsam funktionierende. Und dann werden Menschen sich fragen: warum ist SPSS so langsam, warum ist SPSS so ein schlechtes Software, warum implimentiert sie das was andere nicht implementieren, was gar nicht üblich ist, was wir nie so gemacht haben? SPSS ist ein kommerzelles Produkt und IBM versucht nur das anerkannte (und nicht exotisches) zu verkaufen. Vielleicht aber hatte SPSS aber auch keinen guten Clusteranalytiker bei der Entwicklung gehabt.

Die andere Frage wäre: Wozu brauchen Sie etwas anderes als Euklidische Distanz? Schreiben Sie eine Habilitation? Mir schein es auch, dass Sie meine vorherige Frage doch nicht beantwortet hatten. Die Distanz und Clusterungsmethode kann vom Problemfall zum Problemfall variieren.

Re: Hierarchische Clusteranalyse auf Prozentverteilung

BeitragVerfasst: So 7. Aug 2016, 20:51
von Institut_Zwei
Obidamn hat geschrieben:Hallo Institut Zwei,
habe gar nicht mehr mit weiterer Hilfe gerechnet, daher erst jetzt Reaktion. Vielen Dank, das freut mich sehr!
Mich verunsichert eine Warnmeldung in SPSS bei Durchfühurng einer hierarchischen CA: "Das quadrierte euklidische Distanzmaß sollte verwendet werden, wenn die Cluster-Methoden CENTROID, MEDIAN oder WARD gewünscht sind."
Hierauf brauche ich eine Antwort, bzw. umgekehrt muss ich wissen, warum ich Ward nicht in Verbindung mit dem Chi2 Maß wählen sollte. In der Diskussion unten sind wir ein wenig Richtung Abstandsmaße abgedriftet, daher ist das Problem noch nicht gelöst...


Ich habe mit Ihnen auch nicht mehr gerechnet :)

Ich kann ihnen sagen, warum diese Meldung kommt. Weil die SPSS (aber nicht nur SPSS) Softwareentwickler die Centroid, Median und Wardmethode NUR an die Euklidische Distanz anbinden. Theoretisch könnte man auch andere Distanzen, Quasidistanzen, Metriken, Halbmetriken, Pseudometriken verwenden. Aber dies wären keine ethabilierten Methoden und zumal müsste ein neues abgekürztes Algorythmus zur Berechnung der Clusterung matheamtisch entwickelt werden. Ohne diesen würde die Berechung viel viel länger dauern, als "ethabiliert". Somit stünde SPSS vor einem Problem - setzt sie nur die "meistverkaufte" Methode um - oder auch andere und vielleicht nur langsam funktionierende. Und dann werden Menschen sich fragen: warum ist SPSS so langsam, warum ist SPSS so ein schlechtes Software, warum implimentiert sie das was andere nicht implementieren, was gar nicht üblich ist, was wir nie so gemacht haben? SPSS ist ein kommerzelles Produkt und IBM versucht nur das anerkannte (und nicht exotisches) zu verkaufen. Vielleicht aber hatte SPSS aber auch keinen guten Clusteranalytiker bei der Entwicklung gehabt.

Die andere Frage wäre: Wozu brauchen Sie etwas anderes als Euklidische Distanz? Schreiben Sie eine Habilitation? Mir schein es auch, dass Sie meine vorherige Frage doch nicht beantwortet hatten. Die Distanz und Clusterungsmethode kann vom Problemfall zum Problemfall variieren.