Hausarbeit über die k-Means-Cluster-Methode

Alles rund um Clusteranalysen.

Hausarbeit über die k-Means-Cluster-Methode

Beitragvon Kotnascher » So 29. Jan 2023, 21:40

Ich soll eine Hausarbeit über die k-Means-Cluster-Methode schreiben. Es soll ein einfaches Fallbeispiele in R implementiert werden und die entsprechenden Funktionsaufrufe genannt werden. Ich wollte es mit dem Iris Datensatz mittels des stats Pakets demonstrieren. Wie soll ich am besten den Code und die Ergebnisse des Codes bzw. der Befehle einfügen? Als Screenshots aus R oder anders? Dann müsste ich auch ein Bildverzeichnis machen mit den Quellen (also R) oder?
Zudem hatte ich vor ein Streudiagramm mit den Längen und Breiten der Blütenblätter zu erstellen, da man ja schon visuell recht gut 3 Bereiche bzw. Gruppen erkennt, sodass k=3 sinnvoll wäre. Würdet ihr es auch so machen?
Sollte ich trotzdem noch die Ellbogenmethode (sinkende Varianz mit steigendem k) in den Hauptteil einbauen? Ist es da sinnvoll die Formeln selbständig in R zu schreiben oder reicht z.B. der Befehl aus dem factoex Paket, der die sinkende Varianz mit steigendem k darstellt. Leider bin ich mir nicht genau sicher was für die Hausarbeit wirklich relevant ist und ob es eher in den Hauptteil oder den Anhang gehört. Insgesamt soll die Hausarbeit um die 10 Seiten groß sein. Ich bin dankbar für jede Antwort :)
Kotnascher
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 29. Jan 2023, 21:14
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Hausarbeit über die k-Means-Cluster-Methode

Beitragvon PonderStibbons » So 29. Jan 2023, 21:48

PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11300
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2486 mal in 2470 Posts

Re: Hausarbeit über die k-Means-Cluster-Methode

Beitragvon Kotnascher » So 29. Jan 2023, 22:11

?
Kotnascher
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 29. Jan 2023, 21:14
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Hausarbeit über die k-Means-Cluster-Methode

Beitragvon PonderStibbons » So 29. Jan 2023, 23:46

Kotnascher hat geschrieben:Ich bin dankbar für jede Antwort
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11300
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2486 mal in 2470 Posts

Re: Hausarbeit über die k-Means-Cluster-Methode

Beitragvon bele » Mo 30. Jan 2023, 10:56

Hallo,

Kotnascher hat geschrieben:Es soll ein einfaches Fallbeispiele in R implementiert werden und die entsprechenden Funktionsaufrufe genannt werden. Ich wollte es mit dem Iris Datensatz mittels des stats Pakets demonstrieren.


Hier im Forum gibt es eineinhalb Leute, die Fragen zu R beantworten, im von PonderStibbons verlinkten vier bis fünf. Deshalb war das für den R spezifischen Teil ein sehr guter Ratschlag. Wenn man Fragen zu Strukturgleichungsmodellen und R hat, dann ist dieses Forum allein wegen Holger klar überlegen, sonst für alle R Fragen das verlinkte.

Wie soll ich am besten den Code und die Ergebnisse des Codes bzw. der Befehle einfügen?


Wenn das ganze schon in R erfolgen soll, dann würde es sich anbieten, den ganzen Text in RMarkdown zu schreiben und das Einfügen und Code und Grafiken einfach knitr oder quarto zu überlassen.

Als Screenshots aus R oder anders?


Screenshots von Code und Text sind immer doof. Am einachsten (nach knitr und quarto) wäre wohl, im Textverarbeitungsprogramm irgendeinen Monospaced Font auszuwählen, in Windows böte sich Courier New an.

Dann müsste ich auch ein Bildverzeichnis machen mit den Quellen (also R) oder?


Was formal bei Euren Hausarbeiten gefordert wird können wir Dir beim besten Willen nicht sagen.

Zudem hatte ich vor ein Streudiagramm mit den Längen und Breiten der Blütenblätter zu erstellen, da man ja schon visuell recht gut 3 Bereiche bzw. Gruppen erkennt, sodass k=3 sinnvoll wäre. Würdet ihr es auch so machen?


Gute Visualisierungen sind immer gut.

Leider bin ich mir nicht genau sicher was für die Hausarbeit wirklich relevant ist


Was für die Hausarbeit relevant ist hängt von der genauen Aufgabe ab und am Ende musst Du nach Studium des Themas entscheiden, was da für Dich relevant erscheint und wieviel von den zehn Seiten Grafiken und Code sein dürfen/sollen. Das ist ein Teil des Kerns Deiner Prüfungsleistung.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5813
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1367 mal in 1354 Posts


Zurück zu Clusteranalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron