Korrelation bei nicht-linearem Zusammenhang

Bivariate Korrelation, partielle Korrelation und Rangkorrelation.

Korrelation bei nicht-linearem Zusammenhang

Beitragvon gingerinchen » Do 28. Mär 2024, 00:22

Liebes Forum,
ich bin ganz neu hier, befinde mich in den letzten Zügen meiner Bachelorarbeit Psychologie und - wie auch sonst - komme statistisch nicht weiter, bzw. habe einen Knoten im Kopf.
Ich habe metrische, intervallskalierte Daten erhoben und möchte im Rahmen der ersten beiden Hypothesen gerichtete Korrelationen berechnen. Bei der Überprüfung der Voraussetzungen, stellte sich heraus, dass eine Variable stark rechtsschief verteilt ist, was zwar inhaltlich plausibel, aber nun irgendwie dennoch recht ärgerlich ist. Ich habe die Daten dann ln-transformiert und damit eine annähernde Normalverteilung erreicht. Zur Sicherheit trotzdem die Korrelation nach Spearman berechnet. Aufgrund des Sparkurses der Uni habe ich leider nicht die Möglichkeit SPSS zu nutzen (Testlizenz schon ausgeschöpft), bin also auf ein open-source Programm angewiesen - Jamovi. Aus technischen Gründen kann das aktuell keine Streudiagramme erstellen. Nach Erstellen eines Streudiagrammes (über Datatab) beider Variablen stellte sich heraus, dass da mal so gar kein linearer Zusammenhang zu erkennen ist. Nach kurzer Verzweiflung und weiterer Recherche (robust, nicht robust, ich habe alles gefunden, sodass ich nicht schlauer war als vorher) bin ich auf Kendalls Tau gestoßen, was keinen linearen Zusammenhang als Voraussetzung fordert und somit Verfahren der Wahl zu sein scheint. Ist das statistisch aus Sicht eines Menschen, der wirklich Ahnung von der Materie hat, so richtig und sinnvoll oder verrenne ich mich da?
Ich freue mich sehr auf eure Antworten und hoffe sie bringen Licht in mein müdes Gehirn.
Liebe Grüße
gingerinchen
gingerinchen
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 28. Mär 2024, 00:07
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Korrelation bei nicht-linearem Zusammenhang

Beitragvon PonderStibbons » Do 28. Mär 2024, 02:33

Ich will das noch tadeln, aber da ist jede Menge von Deinen Emotionen
die Rede und kaum von den grundlegenden Sachverhalten, deren
Kenntnis erforderlich ist, um das Problem eventuell lösen helfen zu
können. Bitte einmal darlegen das Studienthema, die konkrete Fragestellung,
das Erhebungsdesign, Variablen und deren konkrete Messverfahren,
Stichprobengröße.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11260
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

folgende User möchten sich bei PonderStibbons bedanken:
gingerinchen

Re: Korrelation bei nicht-linearem Zusammenhang

Beitragvon bele » Do 28. Mär 2024, 08:47

Wie PonderStibbons schon schrieb, fehlt Kontext, daher muss man nachfragen. Hier zum Beispiel scheint es so, als hieltest Du einen linearen Zusammenhang für eine Voraussetzung einer Spearman Korrelation. Spearman und Kendall fordern beide keine Linearität. Beide können mit freier Software berechnet werden. Bestimmt mit PSPP, sicher mit R. PSPP dürfte Dir entgegen kommen wenn Du SPSS gewohnt bist, R ist eine sinnvolle Lerninvestition wenn Du Deine gegenwärtige Abhängigkeit von Lizenzen nachhaltig überwinden willst.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5776
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1356 mal in 1343 Posts

folgende User möchten sich bei bele bedanken:
gingerinchen

Re: Korrelation bei nicht-linearem Zusammenhang

Beitragvon gingerinchen » Do 28. Mär 2024, 10:48

Moin - vielen Dank für eure schnellen Reaktionen. Ich muss noch lernen, wie das hier läuft, sorry.
Studienthema ist der Einfluss des Chronotyps auf den Zusammenhang zwischen Belohnungs- und Bestrafungssensitivität und Suchtverhalten, gemessen über einen einmalig auszufüllenden Online-Fragebogen mit für die Variablen spezifischen Fragebögen (alle intervallskaliert). Stichprobengröße N=193 Datensätze.
Hypothese 1 testet den Zusammenhang zwischen Chronotyp und Sucht, wobei ein negativer Zusammenhang erwartet wird. Da ein Großteil der Studienteilnehmer keine Suchtproblematik (=niedriger Score) aufweist, ist die Verteilung dieser Variable stark rechtsschief. Chronotyp ist normalverteilt. Nach logarithmus-Transformation ist die rechtschiefe Verteilung annähernd normalverteilt. Dass Spearman keinen linearen Zusammenhang voraussetzt, war mir tatsächlich nicht bewusst, weshalb ich Kendall berechnet habe, was auch mit jamovi gut ging. Da fehlt mir nur die Funktion der Streudiagramme, weshalb die nicht vorhandene Linearität erst verspätet aufgefallen ist.
Für die zweite Hypothese wird ein positiver Zusammenhang zwischen Bestrafungssensitivität und Suchtverhalten erwartet. Bestrafungssensitivität ist aber stark linksschief verteilt. Auch mit Transformationen (orientiert hieran: https://statistikguru.de/spss/vorrausse ... ionen.html) wurde es nicht besser. Ist für Kendalls Tau auch die Normalverteilung irrelevant und könnte hier genutzt werden? Auch hier keine Linearität sichtbar.
Ich kann nicht beurteilen inwiefern Verteilung und Linearität zur Berechnung relevant sind, deshalb meine Frage hier - ich hab sogar eine Quelle gefunden, die aussagt Pearsons r sei robust genug, um auch bei nicht-linearen Daten verwendet zu werden.
gingerinchen
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 28. Mär 2024, 00:07
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Korrelation bei nicht-linearem Zusammenhang

Beitragvon PonderStibbons » Do 28. Mär 2024, 12:01

Hypothese 1 testet den Zusammenhang zwischen Chronotyp und Sucht, wobei ein negativer Zusammenhang erwartet wird. Da ein Großteil der Studienteilnehmer keine Suchtproblematik (=niedriger Score) aufweist, ist die Verteilung dieser Variable stark rechtsschief. Chronotyp ist normalverteilt. Nach logarithmus-Transformation ist die rechtschiefe Verteilung annähernd normalverteilt.

Nun hatte ich ja darum gebeten, die Variablen und deren konkrete
Messung zu beschreiben. Das ist leider unterblieben, weswegen ich
nicht verstehe, wie ein ChronoTYP (Typologien sind kategorial)
intervallskaliert sein kann oder was es mit der ominösen Messung
Sucht auf sich hat. Grundlegend, es ist zwar verbreitet, aber
meist unsinnig, allein um einen inferenzstatistischen Test zu
rechnen eine Variable zu transformieren. Was soll in der Sache
eine Aussage bedeuten „die Korrelation zwischen der
ChronoTYP-Messung und dem logarithmischen Sucht-Score
beträgt r=0,23“? Schwer bis gar nicht zu erklären, was es
mit der logarithmierten Sucht so auf sich hat.

Da das Thema Deiner Studie anscheinend eine Moderationsanalyse
erfordert (wie beeinflusst C den Zusammenhang zwischen
Sensitivität und Sucht), ist mir der Zweck dieser Korrelation sowieso
grundlegend nicht klar. Die Korrelation Chronotypmessung und „Sucht“
ist dafür doch gar nicht relevant.

Und wenn Du „Stärke der Sucht“ (?) in einer ganz überwiegend
erst gar nicht betroffenen Population misst, verstehe ich
das Studienkonzept grundsätzlich nicht.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11260
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

folgende User möchten sich bei PonderStibbons bedanken:
gingerinchen

Re: Korrelation bei nicht-linearem Zusammenhang

Beitragvon PonderStibbons » Do 28. Mär 2024, 12:14

NB
ist Linearität eine Frage der Beziehung zwischen Variablen, nicht der Verteilung einer einzelnen Variable.

Und den Pearson kann man selbstverständlich ohne Normalverteilung berechnen. Worum es bei der Normalverteilungsbetrachtung geht ist nicht der Koeffizient selber, sondern die Zuverlässigkeit des
statistischen Signifikanztests für den Koeffizienten.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11260
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

Re: Korrelation bei nicht-linearem Zusammenhang

Beitragvon gingerinchen » Do 28. Mär 2024, 12:56

Danke für deine Geduld mit mir ;) .
Gemessen wird der Chronotyp über den DMEQ, der bildet aus verschiedenen Items (diverse Likert-Skalen) einen Gesamtscore, wobei gilt je niedriger der Wert, desto später ist der Chronotyp. Es gibt auch die Möglichkeit den Score in Kategorien zu transformieren, da mich aber die Tendenz interessiert, nutze ich den numerischen Score und nicht die Kategorien. Das Konstrukt Sucht wird mit dem WHO ASSIST gemessen, der substanzspezifische Summenscores aus verschiedenen abgefragten Symptombereichen bildet. Da mich die "allgemeine Suchtanfälligkeit" interessiert, habe ich einen Gesamtsummenscore aus allen Einzelscores berechnet (Cronbachs alpha .92) um "Sucht" abzubilden. Die Korrelation zwischen Sucht und Chronotyp ist eine Replikation von bestehender Forschung und theoretisch wichtig, da ich innerhalb der Moderatoranalyse ja davon ausgehe, dass es einen Zusammenhang zwischen BIS/BAS und Sucht gibt, aber auch zwischen Chronotyp und Sucht, wobei Chronotyp als Moderator wirkt. Oder hat der Moderator in der Regel keinen Zusammenhang zur AV? Problem für die Moderationsanalyse ist leider auch die fehlende Linearität.
Die transformierte Variable habe ich auch für die Moderationsanalyse (habe sie natürlich trotzdem gerechnet) genutzt. Es zeigt sich kein Moderationseffekt. Wäre aber auch seltsam gewesen, da es zwischen BAS und Sucht auch die erwartete gerichtete Korrelation nicht gibt (spearmans rho -.18, p=.992) - der Zusammenhang ist genau anders herum als erwartet.
Zur Stichprobe und der Variable Sucht - 42% der Versuchspersonen haben eine Suchtproblematik. Es ist also nicht der Großteil, der keine Suchtproblematik aufweist, sondern eher das häufige Vorkommen des niedrigstmöglichen Skalenwerts, der gehäuft vorkommt (22 mal bei 193 Datensätzen). Ich kann die ja aber auch nicht einfach rausnehmen, da sie ja inhaltlich wichtig sind, deshalb die Idee mit der Transformation.
Wie ich die logarithmierte Sucht inhaltlich interpretieren kann, darüber habe ich mir noch gar keine Gedanken gemacht. :shock:
Vielen Dank für diesen Austausch und die Denkanstöße!!
Nochmal zu Spearman - kann der einen Zusammenhang zwischen zwei Variablen, der nicht linear ist, denn ausreichend verlässlich erfassen?
gingerinchen
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 28. Mär 2024, 00:07
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Korrelation bei nicht-linearem Zusammenhang

Beitragvon bele » Do 28. Mär 2024, 19:17

Hallo,

gingerinchen hat geschrieben:DMEQ, der bildet aus verschiedenen Items (diverse Likert-Skalen) einen Gesamtscore, wobei gilt je niedriger der Wert, desto später ist der Chronotyp. Es gibt auch die Möglichkeit den Score in Kategorien zu transformieren, da mich aber die Tendenz interessiert, nutze ich den numerischen Score und nicht die Kategorien.


Das klingt nach einer sehr guten Idee.

Wie ich die logarithmierte Sucht inhaltlich interpretieren kann, darüber habe ich mir noch gar keine Gedanken gemacht. :shock:
Vielen Dank für diesen Austausch und die Denkanstöße!!
Nochmal zu Spearman - kann der einen Zusammenhang zwischen zwei Variablen, der nicht linear ist, denn ausreichend verlässlich erfassen?


Der Spearman führt als erstes eine Rangtransformation durch (Ich glaube, Kendall auch, aber das habe ich nicht auswendig im Kopf). Nach der Rangtransformation ist es völlig egal, ob Du vorher irgendwas logarithmiert hast, oder nicht. Monotone Transformationen ändern nichts an der Rangfolge (es sei denn, sie kehren sie exakt um). Für diesen Teil brauchst Du die fragliche Transformation und eine Antwort auf die Frage der Interpretation logarithmierter allgemeiner Suchtanfälligkeit gar nicht.

Ja, Kendall und Spearman sind die Antworten auf "je mehr, desto mehr"-Fragestellungen. Du kannst ja mal erheblich nicht-lineare Phantasiedaten ausprobieren, ob der je größer x umso größer y Zusammenhang erkannt wird.
Beispieldaten könnte man in R so erstellen ( y = x^5):
Code: Alles auswählen
set.seed(4711)
x <- rnorm(10) |> round(3)
y <- x^5 |> round(3)
plot(x,y)
cor.test(x, y, type = "kendall")
data.frame(x, y)

und das Ergebnis könnte dann so aussehen:
Code: Alles auswählen
> data.frame(x, y)
        x      y
1   1.820 19.969
2   1.370  4.826
3   1.196  2.447
4  -0.407 -0.011
5  -0.611 -0.085
6  -1.509 -7.824
7   0.818  0.366
8  -0.965 -0.837
9  -0.045  0.000
10  0.474  0.024


Nach ein bisschen herumprobieren wirst Du hoffentlich das nötige Vertrauen leichter fassen können.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5776
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1356 mal in 1343 Posts

folgende User möchten sich bei bele bedanken:
gingerinchen


Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste