Seite 1 von 1

Robustheit / Ausreißer

BeitragVerfasst: So 8. Dez 2019, 17:23
von Lisa26
Hallo, ich habe einen Datensatz mit ca. 250.000 Einträgen. Dabei kann ich Messfehler / Fehlwerte ausschließen.
Da dennoch ein paar wenige hohe Werte enthalten sind, bin ich mir nicht sicher ob ich die Ausreißer für eine Regressionsanalyse eleminieren muss.
Anbei der Boxplot meiner Daten aus R:

Bild


Kann mir jemand sagen ob und wenn ja ab welchem Wert ich die Ausreißer eliminieren muss?

Viele Grüße

Re: Robustheit / Ausreißer

BeitragVerfasst: So 8. Dez 2019, 21:40
von PonderStibbons
Müssen musst Du gar nichts. Dass Du bei 250.000 Datensätzen Dutzende von "Ausreißern" hast, liegt in der Natur der Sache. Warum solltest Du Deine Daten manipulieren?

Mit freundlichen Grüßen

PonderStibbons

Re: Robustheit / Ausreißer

BeitragVerfasst: So 8. Dez 2019, 22:55
von bele
Das sind linksschief verteilte Daten die der Boxplot nahezu willkürlich in Nichtausreißer und Ausreißer aufspaltet. Erstmal würde ich daran nichts ändern und wenn sich irgendwo später ein Problem zeigen würde eher über eine logarithmische Transformation als über ein Beschneiden nachdenken.

LG,
Bernhard