Spearman Korrelation oder Korrelation logarithmierter Werte

Bivariate Korrelation, partielle Korrelation und Rangkorrelation.

Spearman Korrelation oder Korrelation logarithmierter Werte

Beitragvon Shak » Sa 2. Mai 2020, 19:55

Hallo zusammen,


ich hoffe ihr könnt mir helfen, es ist (hoffe ich) eine ganz einfache Frage. Leider bin ich in Sachen Statistik aber auch nicht besonderes bewandert.

Folgende Ausgangssituation:
Ich habe verschiedene Größenvariablen für rund 1.300 Unternehmen, bspw. die Marktkapitalisierung in USD.
Zum anderen habe ich die Zahl bestimmter Worthäufungen auf den Internetpräsenzen dieser Unternehmen (Werte zwischen 0 und 25).

Nun würde ich gerne den Zusammenhang zwischen diesen Variablen quantifizieren. Eine Vorerwartung habe ich nicht, es könnte sowohl kein Zusammenhang bestehen, als auch ein positiver oder negativer.

Wenn ich in Excel einfach nur die Korrelation berechne (=KORR), erhalte ich einen Wert von -0,0007[...]. Allerdings habe ich auch sehr große Ausreißer bei den Größvenvariablen, die jedoch nicht entfernt werden sollen.

Nun habe ich mich am Spearman-Korrelationskoeffizienten versucht(!). Dazu habe ich zunächst jedem Wert einen Rang zugeordnet (=RANG.MITTELW). Bei den Größenvariablen des Unternehmens hat so fast jeder Wert einen eigenen Rang, während es bei den Worthäufungen natürlich zahlreiche Ränge gibt die mehrfach vergeben wurden.
Von diesen Rängen habe ich dann wieder die Korrelation (=KORR) berechnet und einen Wert von 0,31[...] erhalten, also einen leicht positiven Zusammenhang.

Andererseits habe ich es über eine Logarithmierung des Wertes der Unternehmensgröße versucht (die Worthäufungen habe ich unverändert gelassen). Mit diesen Werten erhalte ich mit =KORR eine Korrelation von 0,201[...]. Wieder leicht positiv, aber schwächer als mit meinem Spearman Verfahren.


Meine Hauptfrage ist: Darf ich das überhaupt so machen?
Ich möchte das ungern als Teil meiner Arbeit abgeben und dann hören müssen, dass ich da kompletten Unsinn verzapft habe. Soweit ich das recherchiert habe benötige ich für diese Varianten keine normalverteilten Daten.

Meine zweite Frage wäre: Wenn beides zulässig ist, kann man pauschal sagen, welches Verfahren angebrachter wäre?
Ich würde ja tendenziell zu der Logarithmierung tendieren, weil ich Spearman nicht über eine direkte Formel, sondern über ein ggf. unsinniges Verfahren ermöglicht habe.


Vielen Dank für jegliche Hilfe und ein schönes Wochenende!

Shak
Shak
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 2. Mai 2020, 19:23
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Spearman Korrelation oder Korrelation logarithmierter We

Beitragvon PonderStibbons » Sa 2. Mai 2020, 20:31

Meine Hauptfrage ist: Darf ich das überhaupt so machen?

Die eigentliche Frage ist, was möchtest Du denn erreichen? Es wirkt, als wäre gar nicht Dein Ziel,
Forschungsfragen zu beantworten, sondern möglichst hohe Korrelationskoeffizienten aus den
Stichüprobendaten zu quetschen.

Variablen mit einem natürlichen Nullpunkt wie Unternehmensgröße, Umsatz etc. werden nicht selten auf
einer logarithmischen Skala dargestellt. Es ist etwas überraschend, dass Dir das vorher noch nicht begegnet
ist.

Und ob der Spearman-Koeffizient für Dich und Deine Zwecke aussagekräftig ist, kannst Du anhand von
dessen Definition selbst entscheiden.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11251
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2469 mal in 2453 Posts

Re: Spearman Korrelation oder Korrelation logarithmierter We

Beitragvon Shak » Sa 2. Mai 2020, 21:05

PonderStibbons hat geschrieben:
Meine Hauptfrage ist: Darf ich das überhaupt so machen?

Die eigentliche Frage ist, was möchtest Du denn erreichen? Es wirkt, als wäre gar nicht Dein Ziel,
Forschungsfragen zu beantworten, sondern möglichst hohe Korrelationskoeffizienten aus den
Stichüprobendaten zu quetschen.

Variablen mit einem natürlichen Nullpunkt wie Unternehmensgröße, Umsatz etc. werden nicht selten auf
einer logarithmischen Skala dargestellt. Es ist etwas überraschend, dass Dir das vorher noch nicht begegnet
ist.

Und ob der Spearman-Koeffizient für Dich und Deine Zwecke aussagekräftig ist, kannst Du anhand von
dessen Definition selbst entscheiden.

Mit freundlichen Grüßen

PonderStibbons



Hallo PonderStibbons und vielen Dank für deine Antwort!


Das kam wohl missverständlich rüber. Wie bei meiner zweiten Frage erklärt tendiere ich ja eher zur Verwendung der Methode mit Logarithmus, also gerade nicht der Methode mit dem höchsten Korrelationskoeffizienten. Die "herkömmliche" Korrelation mit -0,0007[...] habe ich in meinem Beitrag auch nicht weiter bewertet, sondern nur aufgeführt, da diese mein erster Versuch war. Danach fiel mir aber das erwähnte Vorhandensein von großen Ausreißern auf, wodurch diese Methode eher ungeeignet scheint. Wie gesagt habe ich keine bestimmte Erwartung an einen eventuellen Zusammenhang, wenn überhaupt einer besteht.

Selbstverständlich sind mir schon Variablen begegnet, die auf einer logarithmischen Skala dargestellt werden. Aber eben nur als Ergebnis bzw. Präsentationsmittel und nicht was im Hintergrund dafür notwendig war. Ob der Studienersteller bspw. dafür zunächst Tests auf Normalverteilung oder auf sonstige Kriterien durchgeführt hat kann ich dem fertigen Diagramm ja nicht ansehen. Und es ging mir auch eher um meine Unsicherheit, ob ich mit logarithmierten Werten noch bspw. Korrelationen berechnen darf, ohne, dass jegliche inhaltliche Aussagemöglichkeit verloren geht.

Und bei der Aussagekraft des Spearman-Koeffizienten ging es mir auch weniger um die Aussagekraft des Spearman-Koeffizienten an sich, als viel mehr um "meine Variante" des Spearman-Koeffizienten. Sprich zum einen, ob das was ich gemacht habe überhaupt wirklich dem Spearman-Koeffizienten entspricht und zum anderen, ob ich durch mein Verfahren nicht vielleicht die Datengrundlage verhunzt habe.

Ich habe das ja nach bestem Wissen und Gewissen angewandt. Aber vielleicht habe ich ja irgendetwas gemacht was man nicht darf oder was unsinnig ist, wovon ich nur nichts wusste. :)
Shak
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 2. Mai 2020, 19:23
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Spearman Korrelation oder Korrelation logarithmierter We

Beitragvon PonderStibbons » Sa 2. Mai 2020, 21:24

Ob der Studienersteller bspw. dafür zunächst Tests auf Normalverteilung oder auf sonstige Kriterien durchgeführt hat kann ich dem fertigen Diagramm ja nicht ansehen.

Das ist meines Erachtens weitgehend irrelevant, weil Skalierungen nicht davon abhängig
sein sollten, ob irgendetwas normalverteilt ist oder dahingehend zugerichtet wird. Sondern
davon, ob sie dem gemessenen Phänomen und der Fragestellung angemessen sind.
Und es ging mir auch eher um meine Unsicherheit, ob ich mit logarithmierten Werten noch bspw. Korrelationen berechnen darf, ohne, dass jegliche inhaltliche Aussagemöglichkeit verloren geht.

Da Du über Inhalte nicht geschrieben hast, ist das schwer zu beantworten.
Willst Du eine Frage beantworten, die sich mit dem Grad der Monotonität der Beziehungen
befasst? Dann passt Spearman, ansonsten eben nicht. Ergibt es theoretisch und inhaltlich
Sinn, Unternehmensgrößen logarithmisch zu betrachten? Dann skaliere sie dementsprechend.
Und bei der Aussagekraft des Spearman-Koeffizienten ging es mir auch weniger um die Aussagekraft des Spearman-Koeffizienten an sich, als viel mehr um "meine Variante" des Spearman-Koeffizienten.

Dazu kann ich leider nichts sagen. Für statistische Analysen ist Excel meines Erachtens
auch nicht besonders hilfreich.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11251
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2469 mal in 2453 Posts

Re: Spearman Korrelation oder Korrelation logarithmierter We

Beitragvon bele » Sa 2. Mai 2020, 21:48

PonderStibbons hat geschrieben:
Und bei der Aussagekraft des Spearman-Koeffizienten ging es mir auch weniger um die Aussagekraft des Spearman-Koeffizienten an sich, als viel mehr um "meine Variante" des Spearman-Koeffizienten.

Dazu kann ich leider nichts sagen. Für statistische Analysen ist Excel meines Erachtens
auch nicht besonders hilfreich.


Deine Variante des Spearman klingt plausibel, aber die Chance, dass da in Excel irgendwas schief gelaufen ist, ist gegeben. Du kannst nicht wirklich sicher sein, dass Du keinen Fehler gemacht hast und kein anderer kann das nachvollziehen. Mein Vorschlag: Nimm JASP. Das funktioniert gut zusammen mit Excel und nach zwei bis drei Youtube-Videos kannst Du es grundlegend bedienen. (Erst Daten laden, dann unter "Regression" den Punkt "Correlation Matrix"). Dann hast Du eine Bestätigung für das Ergebnis.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5766
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1351 mal in 1338 Posts

Re: Spearman Korrelation oder Korrelation logarithmierter We

Beitragvon Shak » So 3. Mai 2020, 08:32

Alles klar, dann vielen Dank euch beiden. Das hat mir definitiv geholfen. JASP werde ich mir dann auch anschauen.
Shak
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 2. Mai 2020, 19:23
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste