Frage zum Umgang mit Ausreißern

Alle Verfahren der Regressionanalyse.

Frage zum Umgang mit Ausreißern

Beitragvon IStr » Sa 19. Sep 2020, 12:26

Hallo zusammen,

Ich habe in diesem Zusammenhang auch noch eine Frage zu dem Umgang mit Ausreißern und würde mich sehr freuen, wenn mir hier jemand helfen könnte!
Es geht um die richtige "Reihenfolge" beim Vorgehen mit Ausreißern.
Hintergrund ist folgender: meine Bachelorarbeit besteht aus Zusammenhangshypothesen und einer Hypothese die mit multipler Regression zu berechnen ist.

Zu Beginn meiner Datenauswertung habe ich meine Variablen auf Normalverteilung und Ausreißer geprüft. Ich konnte hierbei ein paar wenige Ausreißer identifizieren, die ich jedoch im Datensatz belassen habe. Die Antwortbögen enthielten keine weiteren Auffälligkeiten und somit ging ich davon aus, dass die entsprechenden Teilnehmer wahrheitsgemäß geantwortet haben und die Extremwerte korrekt sind. Da die Variablen nicht normalverteilt waren, wusste ich, dass ich ohnehin bei den Korrelationen mit der Spearman-Methode rechnen müsste, die gegenüber Ausreißern robust ist. Soweit so gut.

Da ich jedoch statistisch nicht so erfahren bin, gehe ich bei meiner Datenanalyse Schritt für Schritt vor und habe zunächst nur die Zusammenhangshypothesen überprüft. Nun bin ich jedoch bei meiner "letzten" Hypothese angelangt, die eine multiple Regression ist. Da ich noch nie eine multiple Regression gerechnet habe, stellte ich erst jetzt fest, dass eine Voraussetzung für die multiple Regression "keine vorhandenen Ausreißer ist". Weitergehend dürfte ich den zentralen Grenzwertsatz betreffend der Normalverteilung nur anwenden, wenn ich mind. 100 Fälle (ohne Ausreißer habe). D.h. sollten meine Residuen nicht normalverteilt sein, dürfte ich die multiple Regression nicht rechnen, obwohl meine Stichprobe n=170 ist.

Meine Frage ist nun: obwohl ich bisher mit allen vorhandenen Daten inklusive Ausreißern gearbeitet habe, dürfte ich im Rahmen des Hypothesentests der multiplen Regression dann einfach Ausreißer ausschließen?
Oder hätte ich Trottel stets zu Beginn der Datenauswertung alle Voraussetzungen für meine Hypothesen kennen und folglich die Ausreißer ausschließen müssen --> folglich darf ich jetzt nochmal alles neu machen? :D Ich werd wahnsinnig.

Vielen Dank für eure Hilfe vorab!

Viele Grüße
Imke
IStr
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 10. Jun 2020, 10:52
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Frage zum Umgang mit Ausreißern

Beitragvon PonderStibbons » Sa 19. Sep 2020, 13:22

So genannte Ausreißer kann man eigentlich erst identifizieren,
wenn man das lineare Modell aufgestellt hat. Insofern sehe
ich kein vorhergehendes Versäumnis.

Für alles andere müsste man auch wissen, worum es inhaltlich
geht, wieviele so genannte Ausreißer es gibt und wie sie
definiert sind.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11251
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2469 mal in 2453 Posts

Re: Frage zum Umgang mit Ausreißern

Beitragvon IStr » Sa 19. Sep 2020, 14:29

Lieber PonderStibbons,

Vielen Dank für die schnelle Antwort!
Also in meiner Studie geht es um Tätigkeitsmerkmale (5 Stück, die ich in meinem Grundmodell als eine Variable behandle).
Hypothese 1: Je höher die Tätigkeitsmerkmale, desto höher x -
Hypothese 2: Je höher die Tätigkeitsmerkmale, desto höher y
Hypothese 3: Je höher x desto höher y.
Hypothese 4: X mediiert die Beziehung zwischen Tätigkeitsmerkmalen und y
Hypothese 5: Eins der 5 Tätigkeitsmerkmale hat den größten Einfluss auf x <-- hier würde ich dann eine multiple Regression rechnen wollen.

Die ersten drei Hypothesen wurden folglich schon mit der Spearman Korrelation untersucht und weitergehend müsste ich dann jetzt Regressionen rechnen.

Bzgl. der Ausreißer habe ich nur, als ich mir die Variablen im Rahmen der deskriptiven Statistik angeguckt habe, Boxplots anzeigen lassen. Insgesamt konnte ich hier 6 Teilnehmer ausmachen, die mir als Ausreißer im Boxplot angezeigt wurden. Würde man die Ausreißer dann vor einer Regression auf andere Art prüfen?

Vielen Dank vorab!
Imke
IStr
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 10. Jun 2020, 10:52
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Frage zum Umgang mit Ausreißern

Beitragvon PonderStibbons » Sa 19. Sep 2020, 14:48

x y und nicht näher beschriebene Tätigkeitsmerkmale sind nicht das, was ich mir unter einer konkreten Studienbeschreibung vorstelle. Ich verstehe nicht, worin der Vorteil bestehen soll, maximal abstrakt zu bleiben.

Was die Ausreißer angeht, wenn Dich das Thema jetzt konkret umtreibt, wäre eventuell mehr Recherche möglich als „SPSS hat das gemacht“. Natürlich kann man die unkonditionale AV betrachten, Holgonaut hat darauf hingewiesen, dass es sich bei Ausreißern um Repräsentanten einer anderen Population handeln könnte. Für die Regressionsanalyse ist meines Erachtens wichtig(er), ob diese Fälle übergroßen Einfluss auf das Ergebnis haben. Falls ja, könnte man alternativ an eine Regressionsanalyse mit robusten Standardfehlern denken. Aber das ist alles ins Blaue, weil ich keine konkrete Idee von Deiner Studie habe.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11251
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2469 mal in 2453 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 3 Gäste

cron