Hierarchische Clusteranalyse auf Prozentverteilung

Alles rund um Clusteranalysen.

Re: Hierarchische Clusteranalyse auf Prozentverteilung

Beitragvon Institut_Zwei » So 7. Aug 2016, 20:47

Obidamn hat geschrieben:Hallo Institut Zwei,
habe gar nicht mehr mit weiterer Hilfe gerechnet, daher erst jetzt Reaktion. Vielen Dank, das freut mich sehr!
Mich verunsichert eine Warnmeldung in SPSS bei Durchfühurng einer hierarchischen CA: "Das quadrierte euklidische Distanzmaß sollte verwendet werden, wenn die Cluster-Methoden CENTROID, MEDIAN oder WARD gewünscht sind."
Hierauf brauche ich eine Antwort, bzw. umgekehrt muss ich wissen, warum ich Ward nicht in Verbindung mit dem Chi2 Maß wählen sollte. In der Diskussion unten sind wir ein wenig Richtung Abstandsmaße abgedriftet, daher ist das Problem noch nicht gelöst...


Ich habe mit Ihnen auch nicht mehr gerechnet :)

Ich kann ihnen sagen, warum diese Meldung kommt. Weil die SPSS (aber nicht nur SPSS) Softwareentwickler die Centroid, Median und Wardmethode NUR an die Euklidische Distanz anbinden. Theoretisch könnte man auch andere Distanzen, Quasidistanzen, Metriken, Halbmetriken, Pseudometriken verwenden. Aber dies wären keine ethabilierten Methoden und zumal müsste ein neues abgekürztes Algorythmus zur Berechnung der Clusterung matheamtisch entwickelt werden. Ohne diesen würde die Berechung viel viel länger dauern, als "ethabiliert". Somit stünde SPSS vor einem Problem - setzt sie nur die "meistverkaufte" Methode um - oder auch andere und vielleicht nur langsam funktionierende. Und dann werden Menschen sich fragen: warum ist SPSS so langsam, warum ist SPSS so ein schlechtes Software, warum implimentiert sie das was andere nicht implementieren, was gar nicht üblich ist, was wir nie so gemacht haben? SPSS ist ein kommerzelles Produkt und IBM versucht nur das anerkannte (und nicht exotisches) zu verkaufen. Vielleicht aber hatte SPSS aber auch keinen guten Clusteranalytiker bei der Entwicklung gehabt.

Die andere Frage wäre: Wozu brauchen Sie etwas anderes als Euklidische Distanz? Schreiben Sie eine Habilitation? Mir schein es auch, dass Sie meine vorherige Frage doch nicht beantwortet hatten. Die Distanz und Clusterungsmethode kann vom Problemfall zum Problemfall variieren.
--
Kurzer
Google: Statistikinstitut Zwei
Institut_Zwei
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Mo 27. Jun 2016, 21:14
Wohnort: Osnabrück
Danke gegeben: 0
Danke bekommen: 3 mal in 3 Posts

Re: Hierarchische Clusteranalyse auf Prozentverteilung

Beitragvon Institut_Zwei » So 7. Aug 2016, 20:51

Obidamn hat geschrieben:Hallo Institut Zwei,
habe gar nicht mehr mit weiterer Hilfe gerechnet, daher erst jetzt Reaktion. Vielen Dank, das freut mich sehr!
Mich verunsichert eine Warnmeldung in SPSS bei Durchfühurng einer hierarchischen CA: "Das quadrierte euklidische Distanzmaß sollte verwendet werden, wenn die Cluster-Methoden CENTROID, MEDIAN oder WARD gewünscht sind."
Hierauf brauche ich eine Antwort, bzw. umgekehrt muss ich wissen, warum ich Ward nicht in Verbindung mit dem Chi2 Maß wählen sollte. In der Diskussion unten sind wir ein wenig Richtung Abstandsmaße abgedriftet, daher ist das Problem noch nicht gelöst...


Ich habe mit Ihnen auch nicht mehr gerechnet :)

Ich kann ihnen sagen, warum diese Meldung kommt. Weil die SPSS (aber nicht nur SPSS) Softwareentwickler die Centroid, Median und Wardmethode NUR an die Euklidische Distanz anbinden. Theoretisch könnte man auch andere Distanzen, Quasidistanzen, Metriken, Halbmetriken, Pseudometriken verwenden. Aber dies wären keine ethabilierten Methoden und zumal müsste ein neues abgekürztes Algorythmus zur Berechnung der Clusterung matheamtisch entwickelt werden. Ohne diesen würde die Berechung viel viel länger dauern, als "ethabiliert". Somit stünde SPSS vor einem Problem - setzt sie nur die "meistverkaufte" Methode um - oder auch andere und vielleicht nur langsam funktionierende. Und dann werden Menschen sich fragen: warum ist SPSS so langsam, warum ist SPSS so ein schlechtes Software, warum implimentiert sie das was andere nicht implementieren, was gar nicht üblich ist, was wir nie so gemacht haben? SPSS ist ein kommerzelles Produkt und IBM versucht nur das anerkannte (und nicht exotisches) zu verkaufen. Vielleicht aber hatte SPSS aber auch keinen guten Clusteranalytiker bei der Entwicklung gehabt.

Die andere Frage wäre: Wozu brauchen Sie etwas anderes als Euklidische Distanz? Schreiben Sie eine Habilitation? Mir schein es auch, dass Sie meine vorherige Frage doch nicht beantwortet hatten. Die Distanz und Clusterungsmethode kann vom Problemfall zum Problemfall variieren.
--
Kurzer
Google: Statistikinstitut Zwei
Institut_Zwei
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Mo 27. Jun 2016, 21:14
Wohnort: Osnabrück
Danke gegeben: 0
Danke bekommen: 3 mal in 3 Posts

Vorherige

Zurück zu Clusteranalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron