Robustheit / Ausreißer

Fragen, die sich auf kein spezielles Verfahren beziehen.

Robustheit / Ausreißer

Beitragvon Lisa26 » So 8. Dez 2019, 17:23

Hallo, ich habe einen Datensatz mit ca. 250.000 Einträgen. Dabei kann ich Messfehler / Fehlwerte ausschließen.
Da dennoch ein paar wenige hohe Werte enthalten sind, bin ich mir nicht sicher ob ich die Ausreißer für eine Regressionsanalyse eleminieren muss.
Anbei der Boxplot meiner Daten aus R:

Bild


Kann mir jemand sagen ob und wenn ja ab welchem Wert ich die Ausreißer eliminieren muss?

Viele Grüße
Lisa26
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 19. Nov 2019, 12:09
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Robustheit / Ausreißer

Beitragvon PonderStibbons » So 8. Dez 2019, 21:40

Müssen musst Du gar nichts. Dass Du bei 250.000 Datensätzen Dutzende von "Ausreißern" hast, liegt in der Natur der Sache. Warum solltest Du Deine Daten manipulieren?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11251
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2469 mal in 2453 Posts

Re: Robustheit / Ausreißer

Beitragvon bele » So 8. Dez 2019, 22:55

Das sind linksschief verteilte Daten die der Boxplot nahezu willkürlich in Nichtausreißer und Ausreißer aufspaltet. Erstmal würde ich daran nichts ändern und wenn sich irgendwo später ein Problem zeigen würde eher über eine logarithmische Transformation als über ein Beschneiden nachdenken.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5766
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1351 mal in 1338 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron