Korrelation klassifizierter Daten

Bivariate Korrelation, partielle Korrelation und Rangkorrelation.

Korrelation klassifizierter Daten

Beitragvon twiek » Di 26. Aug 2014, 13:47

Hallo Leute,

ich bin momentan über meiner Masterarbeit und möchte ein paar einfache Korrelationen mit einbringen. Leider habe ich kaum Ahnung von statistischen Dingen und stehe momentan vor der Frage: "Passt das noch, was ich da mache?"

Ich will die Frage ganz einfach halten. Ich habe beispielsweise eine Excel Tabelle mit 3 Spalten. Spalte 1 ist die Bezeichnung des Produkts, Spalte 2 die Anzahl der Retouren des jeweiligen Produkts und Spalte 3 die Anzahl Arbeitsschritte in der Arbeitsanweisung. Meine Vermutung hier ist, dass ein komplexeres Produkt (mehr einzelne Arbeitsschritte) auch fehleranfälliger ist (mehr Retouren).

Jetzt habe ich für die Daten eine Klassifikation nach der Anzahl der Arbeitsschritte erstellt:
weniger als 10, 10-29, 30-54, 55-79, 80+
Innerhalb der Klassen habe ich jeweils den Mittelwert der nötigen Arbeitsschritte und der Retouren berechnet.
Über diese Mittelwerte habe ich mit dem Befehl =korrel() den Korrelationskoeffizienten berechnen lassen.

Verfälsche ich jetzt das Ergebnis, weil ich mit diesen Mittelwerten rechne anstatt mit den gesamten 84 Einzeldaten?



Außerdem noch eine zweite Frage, die mir während des tippens dieses Textes eingefallen ist:
Darf ich die Daten überhaupt miteinander vergleichen?
Beispielsweise hat Produkt 1 6 Retouren, wurde aber auch nur 30 mal ausgeliefert. Produkt 2 hat ganze 20 Retouren, wird aber 1000 mal ausgeliefert. Muss ich das zuerst miteinander in Relation setzen?


Hoffe ich konnte mein Problem verständlich wiedergeben!
twiek
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 6. Mär 2012, 12:06
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Korrelation klassifizierter Daten

Beitragvon PonderStibbons » Di 26. Aug 2014, 14:27

Berechne die Retourenquote (Retouren / Auslieferungen) und korreliere diese
direkt mit der Zahl der Arbeitsschritte (keine Klassifikation). Vermutlich wäre
ein Vergleich zwischen dem Pearson-Korrelationskoeffizienten r und dem
Spearman-Rangkorrelationskoeffizienten rho hier interessant, ich würde
also beide berechnen (sofern Excel den Spearman vorhält).

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11260
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

Re: Korrelation klassifizierter Daten

Beitragvon twiek » Di 26. Aug 2014, 15:24

Danke für die schnelle Antwort. Das bestätigt meine Vermutung.

Ich habe nach einer Anleitung im Internet mal den Spearman-Rangkorrelationskoeffizienten berechnet. In der Hoffnung, dass sowohl Anleitung (http://www.excel4managers.de/index.php?page=rxysp) als auch Durchführung korrekt waren, kam dabei ein Wert von 0,268 raus.
Beim Pearson-Korrelationskoeffizient, für den es eine eingebaute Funktion in Excel gibt, kam 0,292 raus.

Das sagt mir als Laien erstmal, dass es keine ernsthafte Korrelation zwischen den Werten gibt. Den Unterschied zwischen Spearman und Pearson kann ich allerdings nicht interpretieren.
twiek
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 6. Mär 2012, 12:06
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Korrelation klassifizierter Daten

Beitragvon twiek » Di 26. Aug 2014, 15:42

Sorry für den Doppelpost, aber ich finde keine Edit Funktion ...

Ich habe auch mal den p-Wert berechnen lassen: p = 0,01.
Wie gesagt hab ich nicht viel Ahnung davon, aber soweit ich mich bisher belesen habe bedeutet das soviel wie, dass die Daten trotz schwacher Korrelation trotzdem (irgendwie) voneinander abhängig sind?!
twiek
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 6. Mär 2012, 12:06
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Korrelation klassifizierter Daten

Beitragvon PonderStibbons » Di 26. Aug 2014, 16:05

Ich habe nach einer Anleitung im Internet mal den Spearman-Rangkorrelationskoeffizienten berechnet. In der Hoffnung, dass sowohl Anleitung (http://www.excel4managers.de/index.php?page=rxysp) als auch Durchführung korrekt waren, kam dabei ein Wert von 0,268 raus.
Beim Pearson-Korrelationskoeffizient, für den es eine eingebaute Funktion in Excel gibt, kam 0,292 raus.

Es ist immer ein gutes Zeichen, wenn die nahe beieinanderliegen.
Zum Beispiel bedeutet dies, dass die (Pearson-)Korrelation nicht durch extreme Werte oder
Ausreißer verzerrt wird.
Das sagt mir als Laien erstmal, dass es keine ernsthafte Korrelation zwischen den Werten gibt.

Als Laien sagt Dir das doch eigentlich gar nichts, außer dass es größer
als 0 ist? Was die Einschätzung angeht, 0,29 ist schon recht hoch. In
Wissenschaften vom Lebendigen (Psychologie, Medizin, Ökonomie,
Soziologie, Biologie...) findet man typischerweise Korrelationen
im Bereich 0,1-0,5. Allerdings ist Dein Wert nur ein Stichproben-Wert,
also vom Zufall vergrößert oder verkleinert im Vergleich zum "wahren"
Wert in der Grundgesamtheit.

NB ist ja p < 0,01, man darf also zumindest annehmen, dass tatsächlich
eine überzufällige Korrelation vorliegt.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11260
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

Re: Korrelation klassifizierter Daten

Beitragvon twiek » Do 28. Aug 2014, 14:10

Hallo nochmal,

danke PonderStibbons für deine schnellen Antworten!

Ich möchte trotzdem gerne noch einwas dazu fragen.

Was die Einschätzung angeht, 0,29 ist schon recht hoch. In
Wissenschaften vom Lebendigen (Psychologie, Medizin, Ökonomie,
Soziologie, Biologie...) findet man typischerweise Korrelationen
im Bereich 0,1-0,5.


Kennst du zu dieser Aussage eine seriöse literarische Quelle? Wenn das tatsächlich so ist könnte ich zumindest etwas hineininterpretieren. Ansonsten versuche ich die Statistik sehr sehr gering in meiner Arbeit zu halten, weil ich davon einfach zu wenig Ahnung und auch zu wenig Zeit um mich korrekt einzulesen habe.
twiek
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 6. Mär 2012, 12:06
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Korrelation klassifizierter Daten

Beitragvon PonderStibbons » Do 28. Aug 2014, 14:51

Jacob Cohen hat ein paar Einschätzungen abgegeben, was eine "kleine", "mittlere" oder "große"
Korrelationshöhe ist, wobei er aber warnend darauf hinweist, dass das immer von den Umständen
abhängt. Er orienterte sich dabei hauptsächlich an den Korrelationshöhen, wie man sie in der
Forschungsliteratur findet. Du kannst also mal nach Cohen Effektstärke Korrelation groß mittel
klein
oder dergleichen suchen, falls Dir das seriös genug ist.

Wie gesagt bezieht sich das aber auf Populations-Korrlationen. Der in Deiner Stichprobe ist
verzerrt durch den Stichprobenfehler, weswegen eine Diskussion auf wenig Verläßlichem
basiert, außer Deine Stichprobe ist so groß, dass die erwartete Verzerrung nur klein ist.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11260
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts


Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron