Seite 1 von 1

Pearson Korrelation bei nicht parametrischen Daten

BeitragVerfasst: Do 1. Nov 2018, 21:36
von hansilein
Hallo,

ich habe Daten einer Studie mit n=31 Probanden.
Ich habe für jeden Probanden 2 Ergebnisse (Baseline & Treatment) wie sie eine Aufgabe erledigt haben.
Werte reichen dabei von 0 - 1,2.
Beim Treatment wurden die Probanden abgelenkt und haben deshalb schlechter Performed. Ich habe jetzt zusätzlich noch Daten wie oft sie durch die Ablenkung weggeschaut haben und wie lange das im Durchschnitt war.
Also Proband 5 z.B. hat 20 mal von der eigentlichen Aufgabe weggeschaut und durchschnittlich etwa 500ms. Andere Probanden anders häufig und im Durchschnitt länger oder kürzer.

Ich würde jetzt gerne schauen ob eine Korrelation zwischen der Häufigkeit des Wegschauens oder der Durchschnittlichen Länge des Wegschauens mit der Performance die sie erzielt haben gibt.

Diff <- Treatment - Baseline
Also cor.test(AnzahlBlicke, Diff)
cor.test(DurchschnBlickdauer, Diff)

Jetzt ist das Problem dass die Differenzen von Treatment und Baseline nicht normalverteilt sind nach Shapiro.Wilk. Ich also die Daten transformieren müsste.
Wie funktioniert das mit der Korrelation?

Ich transformiere als Treatment und Baseline Daten und aber die andere Variable (Anzahl Blicke) lasse ich so und transformiere sie nicht? Oder doch?

Vielen Dank!

Re: Pearson Korrelation bei nicht parametrischen Daten

BeitragVerfasst: Do 1. Nov 2018, 22:39
von PonderStibbons
Es gibt keine nichtparametischen Daten, es gibt nichtparametrische Tests.
Falls Du hinsichtlich der Pearson-Korrelation bedenken hast, verwende den Spearman-Koeffizienten.

Mit freundlichen Grüßen

PonderStibbons

Re: Pearson Korrelation bei nicht parametrischen Daten

BeitragVerfasst: Do 1. Nov 2018, 22:56
von hansilein
Stimmt, das ergibt Sinn.

D.h. eine Transformation zu verwenden ergibt keinen Sinn oder ist nicht möglich?

Re: Pearson Korrelation bei nicht parametrischen Daten

BeitragVerfasst: Fr 2. Nov 2018, 09:22
von PonderStibbons
Spearman verwendet die rangtransformierten Ausgangsdaten.

Mit freundlichen Grüßen

PonderStibbons

Re: Pearson Korrelation bei nicht parametrischen Daten

BeitragVerfasst: Fr 2. Nov 2018, 14:12
von hansilein
D.h. hier gilt nicht wie beim t-test dass ich bei n>30 parametrische Tests anwenden kann?

Wie sieht es mit der Frage aus, macht es Sinn eine Transformation anzuwenden oder ist das nicht möglich?

Re: Pearson Korrelation bei nicht parametrischen Daten

BeitragVerfasst: Fr 2. Nov 2018, 14:32
von PonderStibbons
Transformationen nur um der Herstellung von "Normalverteilung" willen ergibt selten Sinn.

Mit freundlichen Grüßen

PonderStibbons

Re: Pearson Korrelation bei nicht parametrischen Daten

BeitragVerfasst: Mo 4. Feb 2019, 16:05
von forenthomas
Hallo Hansilein,

hansilein hat geschrieben:D.h. hier gilt nicht wie beim t-test dass ich bei n>30 parametrische Tests anwenden kann?


klar könntest du das - wenn du dich auf die Mittelwerte beziehen wollen würdest. Denn nur die sind laut zentralem Grenzwertsatz, auf den du dich hier implizit beziehst, auch bei nicht normalverteilten Daten bei größeren Stichproben annähernd normalverteilt. Aber das willst du ja nicht ;) .

Gruß, Thomas

Re: Pearson Korrelation bei nicht parametrischen Daten

BeitragVerfasst: Mo 4. Feb 2019, 17:07
von bele
Die Funktion cor.test bietet Dir neben der Pearson-Korrelation auch die Spearman-Korrelation und Kendalls tau an. Zu steuern über das method-Argument. Bequemer als mit einem
Code: Alles auswählen
cor.test(DurchschnBlickdauer, Diff, method = "spearman")
wirst Du es nicht bekommen. Und der Statistikteil im Paper kann auch kaum bequemer zu schreiben sein, als wenn Du Dich auf die Spearman-Korrelation berufst.
Wenn es unbedingt die Pearson-Korrelation sein soll, dann darfst Du die halt nicht über die t-Verteilung testen. Du könntest z. B. ein 95%-Konfidenzintervall für r durch bootstrapping bestimmen und schauen, ob es die 0 umfasst. Die Wikipedia enthält noch andere Testmöglichkeiten, die ohne die t-Verteilung funktionieren: https://en.wikipedia.org/wiki/Pearson_c ... #Inference Macht halt alles mehr Aufwand bei der Umsetzung und im Methodenteil.


LG,
Bernhard