Pearson Voraussetzung Ausreißer

Bivariate Korrelation, partielle Korrelation und Rangkorrelation.

Pearson Voraussetzung Ausreißer

Beitragvon Minor19 » Mo 26. Dez 2022, 18:56

Hallo,

um eine Pearson Korrelation durchzuführen, sollten keine Ausreißer bestehen beziehungsweise keine Starken. Ich habe mi anhand eines Boxplots die Ausreißer darstellen lassen. Es sind keine extremen Ausreißer zu erkennen. Allerdings gibt es 6 Ausreißer mit relativ hohen zahlen (153, 86, 53,...). Nun weiß ich nicht, ob ich eine Pearson Korrelation durchführen sollte.

Mit freundlichen Grüßen
Minor19
Beobachter
Beobachter
 
Beiträge: 11
Registriert: So 25. Dez 2022, 14:26
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Pearson Voraussetzung Ausreißer

Beitragvon bele » Mo 26. Dez 2022, 19:25

Hallo minor19,

eine Möglichkeit wäre, anstelle der Boxplots ein Streudiagramm zu zeichnen und visuell zu beurteilen, ob es eine große Punktwolke und dann einzelne Punkte gibt, die weit davon entfernt liegen. Eine andere Möglichkeit wäre, eine Regressionsgerade durch alle Punkte und eine zweite durch die Punkte ohne die Verdächtigen zu legen und zu schauen, ob die Gerade durch durch die fraglichen sechs Punkt stark von ihrer usprünglichen Richtung abgelenkt wird. Wenn man will, kann man die Leverage für jeden Punkt ausrechnen: https://en.wikipedia.org/wiki/Leverage_(statistics)

Lg,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5743
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1339 mal in 1326 Posts

folgende User möchten sich bei bele bedanken:
Minor19

Re: Pearson Voraussetzung Ausreißer

Beitragvon Minor19 » Mo 26. Dez 2022, 19:56

Danke für die Antwort!
Beim Streudiagramm gibt es eine große Punktewolke. Ich denken demnach geht Pearson nicht oder?
Minor19
Beobachter
Beobachter
 
Beiträge: 11
Registriert: So 25. Dez 2022, 14:26
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Pearson Voraussetzung Ausreißer

Beitragvon bele » Mo 26. Dez 2022, 20:03

Wenn aus der Punktwolke nicht einzelne Punkte herausstechen, die weit weg und in der ganz falschen Richtung sind, dann spricht das dagegen, dass Ausreißer entfernt werden müssen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5743
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1339 mal in 1326 Posts

Re: Pearson Voraussetzung Ausreißer

Beitragvon Minor19 » Mo 26. Dez 2022, 20:50

Ich habe nun den zstandardisiertes Wert für Kurtosis und Schiefe berechnet. Zwei meiner Variablen sind laut dem Wert normalverteilt und zwei nicht. Kannst du mir konkret sagen ob ich deshalb Spearman machen soll?
Minor19
Beobachter
Beobachter
 
Beiträge: 11
Registriert: So 25. Dez 2022, 14:26
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Pearson Voraussetzung Ausreißer

Beitragvon bele » Mo 26. Dez 2022, 21:17

Kannst Du mir sagen, ob ich an Silvester zu meiner Mutter fahren sollte?

Ich würde so eine Entscheidung von einer Gesamtkonstellation abhängig machen, nicht allein von Kurtosis, Schiefe oder einem Test auf Normalverteilung. Worum geht es, was kann passieren, wenn der Test daneben liegt, wieviele Beobachtungen habe ich, suche ich in Wahrheit nach einem monotonen oder nach einem linearen Zusammenhang, stehen mir Testverfahren zur Verfügung, die nicht auf bivariate Normalverteilung setzen, wer ist mein Publikum und so weiter.

Die Frage nach Ausreißern und die nach der Normalverteilung sind auch sehr unterschiedliche Fragen. Während Ausreißer tatsächlich den Wert der Korrelation beeinflussen ist die Frage nach der Verteilung für die Berechnung des Korrelationskoeffizienten ganz irrelevant und nur für die Signifikanztestung unter Umständen relevant.

HTH,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5743
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1339 mal in 1326 Posts

Re: Pearson Voraussetzung Ausreißer

Beitragvon kerst1n1919 » Mo 26. Dez 2022, 22:52

Ich dachte, dass bei einer Normalverteilung automatisch wenig Ausreißer vorhanden sind?
Aber was soll ich den noch machen außer Kurtosis/Schiefe und verschiedene Diagramme? Shapiro Wilk Test? Ich möchte einen linearen Zusammenhang testen, das ist doch dasselbe wie Normalverteilung?

KAnnst du mir sagen, was die Zahlen bei den Ausreißern bei einem Boxplot zu bedeuten haben? Also bedeuten hohe Zahlen viele Ausreißer?

Ich hoffe sehr du kannst mir weiterhelfen, ich bin schon verzweifelt....

LG Minor19
kerst1n1919
Mitglied
Mitglied
 
Beiträge: 23
Registriert: Mi 21. Dez 2022, 14:01
Danke gegeben: 8
Danke bekommen: 0 mal in 0 Post

Re: Pearson Voraussetzung Ausreißer

Beitragvon bele » Di 27. Dez 2022, 00:53

kerst1n1919 hat geschrieben:Ich dachte, dass bei einer Normalverteilung automatisch wenig Ausreißer vorhanden sind?


Ist das so? Wenn ich eine Stichprobe von 1000 normalverteilten Zahlen nehme und die Regeln des Boxplots für Ausreißer anlege, dann sind da im Schnitt 7,2 Ausreißer dabei. Nehme ich 1000 uniform-/gleichverteilte Zahlen und die gleichen Regeln, dann sind da gar keine Ausreißer dabei. Unter diesen Bedingungen wären in der Normalverteilung also mehr Ausreißer vorhanden. Vielleicht stimmt die Regel nicht?

Ich möchte einen linearen Zusammenhang testen, das ist doch dasselbe wie Normalverteilung?


Ist das so? Jeder Deutsche ist nach seinem Geburtstag einen Tag älter als vor seinem Geburtstag. Das ist ein linearer Zusammenhang zwischen Alter vor und Alter nach Geburtstag, auch wenn die Altersangaben nicht normalverteilt sind. Vielleicht stimmt diese Gleichsetzung also auch nicht.

KAnnst du mir sagen, was die Zahlen bei den Ausreißern bei einem Boxplot zu bedeuten haben?


Welche Zahlen beim Boxplot? Hier ist ein annotiertes Bild von einem Boxplot, das ich aus der Wikipedia verlinkt habe (https://de.wikipedia.org/wiki/Box-Plot):

Bild

Da sieht man links im Bild drei "Ausreißer".

Also bedeuten hohe Zahlen viele Ausreißer?


Alle drei Ausreißer im oben verlinkten Bild entsprechen nicht großen, sondern kleinen Zahlen.

Die Definition des "Ausreißers" aus den Zeichenregeln des Boxplots sind auch nur für Boxplots wichtig. Keinesfalls bedeuten sie irgendwie einen Automatismus für andere Rechenverfahren. Wie ich oben ja schon geschrieben habe, kommen auch bei perfekt einer Normalverteilung entnommenen Stichproben solche Ausreißer vor.

Ich hoffe sehr du kannst mir weiterhelfen, ich bin schon verzweifelt....


Das tut mir ja herzlich Leid, aber im Moment sehe ich nicht, wie ich das machen könnte.

Bist Du jetzt eigentlich Minor19 oder kerst1n1919 oder seid Ihr beide die gleiche Person?

Gruß,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5743
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1339 mal in 1326 Posts

Re: Pearson Voraussetzung Ausreißer

Beitragvon Minor19 » Di 27. Dez 2022, 11:45

Bei SPSS stehen Zahlen beiden Kreisen dabei, die meine ich ich. Welche Bedeutung haben die?

Ich habe nun schon verstanden, dass ich auf Bivariate Normalverteilung schauen sollte, allerdings kann man das mit SPSS nicht überprüfen.
Minor19
Beobachter
Beobachter
 
Beiträge: 11
Registriert: So 25. Dez 2022, 14:26
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Pearson Voraussetzung Ausreißer

Beitragvon PonderStibbons » Di 27. Dez 2022, 12:09

Die Zahlen sind vermutlich die Fallnummern in der Daten-Datei.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

Nächste

Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste