von Streuner » So 22. Jul 2012, 11:29
Hey,
also zunächst solltest du dir darüber im klaren sein, welches Verfahren zum Clustern genutzt wurde. Grob gesagt, kannst du einmal von fein nach grob clustern und umgekehrt. Bei "fein nach grob" siehst du jeden Punkt als eigenen Cluster an und ziehst dann Punkte zu größeren Clustern zusammen.
Bei "grob nach fein" ist es genau umgekehrt, du nimmst alle Punkte zusammen und nimmst dann die Punkte raus, die nicht passen (unter verschiedenen Gesichtspunkten)
Beim Verfahren "fein nach grob" bietet sich das Single Linkage Verfahren an, du berechnest zwischen jedem Punkt die Distanz / Abstand (hier musst du schauen welche Distanz du nimmst, euklidische Abstand, Mahalanobis Distanz etc ) und nimmst die beiden Punkte zusammen mit dem geringsten Abstand. Im nächsten Schritt berechnest du dann wieder alle Abstände zwischen den verbleibenden Punkten und zwischen allen Punkten und dem Cluster, dann ziehst du wieder die Punkte zusammen mit dem kleinsten Abstand, dabei kann entweder ein zweites Cluster entstehen oder du ziehst den Punkt ins bestehende Cluster mit ein. Das machst du dann Iterativ solange bis zu einem (dir definierten oder vorgegebenen) Ergebnis kommst.
Beim Verfahren "grob nach fein" bietet sich das Complete Linkage Verfahren an , du berechnest wie oben wieder die Distanz / Abstand zwischen allen Punkten und schließt den Punkt mit dem größten Abstand aus deinem Gesamt Cluster aus. Das machst du dann auch wieder iterative soweit bist du zu einem Ergebnis kommst.
Als Mittelweg gäbe es dann noch das Average Linkage Verfahren, was über die gemittelten Abstände geht.
Vielleicht schaust du dir einfach mal "Hierarchische Clusteranalyse" auf Wiki an, dort sind alle Verfahren (gibt noch ein paar mehr als die von mir erwähnten) aufgelistet und auch ein Bsp mal durchgerechnet woran man recht gut erkennt wie diese Verfahren arbeiten.
Mit freundlichen Grüßen,
M.