Seite 1 von 1

Korrelation im Diagramm visualisieren

BeitragVerfasst: Sa 13. Jan 2018, 14:56
von dolu28
Guten Tag,

ihabe eine Frage zur Visualisierung von Zusammenhängen.
Ich habe die Korrelation von 3 Merkmalen berechnet, also
1.Korrelation ( a und c)
2.Korrelation ( b und c)

und habe dafür die Werte
1. r= -0.08
2. r= -0.34

Dazu habe ich jetzt 2 Streudiagramme gemacht, aber ich weiß nicht ob die Visualisierung zu diesen Werten passt.
1.http://www.bilder-upload.eu/show.php?fi ... 845946.png
2.http://www.bilder-upload.eu/show.php?fi ... 845967.png
Ich weiß das wenn die Korrelation nähe 0 ist, die Punkte sich kreisförmig anordnen, so dass keine Gerade lokalisiert
werden kann, die die Punkteverteilung am besten repräsentiert.
Kann mir einer vllt. ein Feedback dazu geben
MfG

Re: Korrelation im Diagramm visualisieren

BeitragVerfasst: Sa 13. Jan 2018, 17:52
von bele
Hallo dolu,

Deine beiden Grafiken taugen wenig (erste) bis nichts (zweite), weil man überhaupt nicht abschätzen kann, wieviele Punkte da übereinander liegen. Du musst irgendwas tun, um das zu entzerren. Dafür gibt es verschiedene Ansätze. Welche leicht zu machen sind und gut aussehen, hängt aber auch von dem verwendeten Computerprogramm ab.

Wenn das R sein sollte, kann man die Werte mit der Funktion jitter() entzerren oder die Funktion sunflowerplot verwenden oder im Package ggplot2 geom_count() oder (scheint mir gerade am eleganstesten) das Paket beeswarmhttp://www.cbs.dtu.dk/~eklund/beeswarm/
Wenn das R sein sollte, poste mal den Code, der die Grafik erstellt.

Wenn nicht R, dann kann Dir vielleicht ein anderer hier helfen.

LG,
Bernhard

Re: Korrelation im Diagramm visualisieren

BeitragVerfasst: Sa 13. Jan 2018, 19:51
von dolu28
Ja, ist mit R programmiert. Danke für dein Tipp mit der Funktion. Habe es gemacht und es kommt das hier raus:
http://www.bilder-upload.eu/show.php?fi ... 866115.png
http://www.bilder-upload.eu/show.php?fi ... 866272.png

Hier mein Code:
Code: Alles auswählen
plot(jitter(train$Age),jitter( train$Survived), ylim = c(-1,2))
plot(jitter(train$Pclass), jitter(train$Survived), ylim = c(-1,2))


Taugen die Grafiken vllt jetzt was ?
LG