Korrelationen mit logarithmierten Daten

Bivariate Korrelation, partielle Korrelation und Rangkorrelation.

Korrelationen mit logarithmierten Daten

Beitragvon derhighlander » Di 2. Feb 2021, 14:08

.
Zuletzt geändert von derhighlander am Do 25. Feb 2021, 13:59, insgesamt 1-mal geändert.
derhighlander
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Di 2. Feb 2021, 14:01
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Korrelationen mit logarithmierten Daten

Beitragvon strukturmarionette » Di 2. Feb 2021, 14:35

N?
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4314
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 582 mal in 579 Posts

Re: Korrelationen mit logarithmierten Daten

Beitragvon derhighlander » Di 2. Feb 2021, 15:07

Knapp 170000
derhighlander
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Di 2. Feb 2021, 14:01
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Korrelationen mit logarithmierten Daten

Beitragvon strukturmarionette » Di 2. Feb 2021, 15:15

Für Inferenzstatistik stellt sich dann die Frag nach NV nicht.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4314
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 582 mal in 579 Posts

Re: Korrelationen mit logarithmierten Daten

Beitragvon bele » Di 2. Feb 2021, 15:22

Hallo derhighlander,

derhighlander hat geschrieben:Die Daten, die ich zur Verfügung habe und zwischen denen ich Korrelationen bestimmen muss sind nicht normalverteilt sondern stark gekrümmt.


Ich kenne schiefe Verteilungen und aber gekrümmte Daten? Meinst Du damit schief verteilte Daten oder meinst Du damit, dass es einen kurvilinearen Zusammenhang zwischen den beiden Variablen gibt?

Meine Frage ist jetzt ob ich das einfach so machen kann und wenn ja, ob ich dann noch am Ergebnis irgendwas anders interpretieren muss


Anders als was? Du kannst nicht die Linearität von logarithmierten Daten als Maß für die Linearität nicht-logarithmierter Daten verkaufen. Wenn Du nicht ohnehin schon die Daten für sinnvoll zu logarithmieren gehalten hast, wäre vielleicht eine Rangtransformation im Sinne einer Spearman-Korrelation eine sinnvolle Alternative. Nur so als Gedankenanstoß.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5785
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1358 mal in 1345 Posts

Re: Korrelationen mit logarithmierten Daten

Beitragvon PonderStibbons » Di 2. Feb 2021, 15:33

Was sind das für Variablen, mit welcher Fragestellung werden sie korreliert?
Wie hast Du die Schiefe (?) bestimmt (grafisch?)? Und warum willst Du nicht die
schief (?) verteilten Variablen nehmen? Der Pearson-Koeffizient als solcher
ist valide, egal wie die Daten verteilt sind, und solltest Du Dir wegen
Signifikanztesterei Gedanken machen, bei 17.000 Fällen stellt sich ein
Problem (wie bereits oben angemerkt wurde) sicher nicht.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11273
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts

Re: Korrelationen mit logarithmierten Daten

Beitragvon derhighlander » Di 2. Feb 2021, 16:21

.
Zuletzt geändert von derhighlander am Do 25. Feb 2021, 13:59, insgesamt 1-mal geändert.
derhighlander
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Di 2. Feb 2021, 14:01
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Korrelationen mit logarithmierten Daten

Beitragvon PonderStibbons » Di 2. Feb 2021, 16:39

Ich hatte gedacht, dass eine Voraussetzung für die valide Anwendung des Pearson Faktors ist, dass die Daten normalverteilt sind.

Der Koeffizient ist der Koeffizient, egal wie deine Daten verteilt sind. Und wie gesagt, der statistische Test
des Koeffizienten (nur für den nimmt man normalverteilte Grundgesamtheiten an) ist bei sehr hohen Fallzahlen
und entsprechenden winzigen Stichprobenfehlern keine Diskussion mehr wert. Allerdings habe ich keine wirkliche
Vorstellung, was Du womit korrelierst, ich verstehe Deine Studienbeschreibung leider nicht. Die 170.000 ist die
Zahl der untersuchten Webseiten?
Wenn die Beziehungen zwischen den Variablen eindeutig non-linear sind oder aus einem inhaltlichen Grund eine
Transformation wie z.B. Logarithmieren naheliegt, kann man natürlich neu überlegen. Ansonsten wäre ja die Frage,
was "die Korrelation zwischen der logarithmierten Variable A und der logarithmierten Variable B ist r=0,13" bedeuten
soll. Schiefe > 4 ist allerdings bemerkenswert.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11273
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts

Re: Korrelationen mit logarithmierten Daten

Beitragvon derhighlander » Di 2. Feb 2021, 16:50

.
Zuletzt geändert von derhighlander am Do 25. Feb 2021, 14:00, insgesamt 1-mal geändert.
derhighlander
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Di 2. Feb 2021, 14:01
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Korrelationen mit logarithmierten Daten

Beitragvon PonderStibbons » Di 2. Feb 2021, 17:48

Ok, aufgrund der Natur der Daten kann man über Logarithmen durchaus reden.
Wir haben es ja hier mit exponenziellem Wachstum zu tun, nicht mit linearem.
Wie viele und welche VariabLen hast Du zur Vorhersage der Abonnentenzahlen?
Und welches ist der Zweck der Studie, was für Konsequenzen haben dei Ergebnisse?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11273
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts

Nächste

Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste