Seite 1 von 1

Logistische Regression/ Verletzung Voraussetzung Ausreißer

BeitragVerfasst: Di 11. Feb 2020, 10:54
von Gianni_LL
Hallo liebe alle,

ich habe beim Prüfen der Voraussetzungen bei meiner logistischen Regression Ausreißer festgestellt (also zwei Fälle haben ein stand. Residuum von über 3, die eine sogar von über 9). An sich gilt ja die Regel (soweit ich mich reingelesen habe), dass wenn die Ausreißer unter 5% der Probandenanzahl bleiben, akzeptabel sind. Ich habe in dieser Analyse 97 Probanden. Dies wäre so also eigentlich m.W. in Ordnung.
Dennoch frage ich mich, ob so hohe Werte, also "extreme Ausreißer" (von vor allem 9) wirklich in der Analyse bleiben sollten? Verzerrt das die Regression nicht enorm?

Vielen Dank!

Re: Logistische Regression/ Verletzung Voraussetzung Ausreiß

BeitragVerfasst: Di 11. Feb 2020, 13:40
von PonderStibbons
Verzerrt das die Regression nicht enorm?

Das musst Du nicht hier fragen, das kannst Du leicht selbst feststellen.

Zudem würde ich mir den betreffenden Fall daraufhin ansehen, ob er Eigentümlichkeiten aufweist
(z.B. Hinweise auf einen möglichen Eingabefehler).

Mit freundlichen Grüßen

PonderStibbons

Re: Logistische Regression/ Verletzung Voraussetzung Ausreiß

BeitragVerfasst: Di 11. Feb 2020, 14:18
von bele
PonderStibbons hat geschrieben:
Verzerrt das die Regression nicht enorm?

Das musst Du nicht hier fragen, das kannst Du leicht selbst feststellen.


Ich würde das probehalber mal ohne diesen Fall rechnen und schauen, ob sich an der Grundaussage der Ergebnisses was ändert. Ansonsten alles tun, um diesen Fall aufzuklären. Vielleicht gehört er in eine andere Grundgesamtheit? Vielleicht lässt sich aus diesem einen Fall was spannendes lernen?

LG,
Bernhard

Re: Logistische Regression/ Verletzung Voraussetzung Ausreiß

BeitragVerfasst: Di 11. Feb 2020, 21:11
von Gianni_LL
Also, ich habe meine Daten nun noch einmal kontrolliert und es ergaben sich tatsächlich zwei Ungereimtheiten beim Antwortverhalten zweier Probanden, wonach sich das eine Problem beseitigen ließ. :) Danke schon einmal für diesen Tipp!!

Dennoch habe ich immer nun immer noch ein ZResid von über 4 (Bei einem anderen Probanden).

Nur für mein generelles Verständnis nun: Wenn dies nichts mit Eingabefehlern und ansonsten unstimmigen Aussagen/theoretisch falschen Überlegungen zu tun haben kann, lässt man den Probanden trotz Verletzung der Voraussetzungen drin? (Also die Ergebnisse des Modells ändern sich nämlich, wenn ich mit und ohne diesen Probanden rechnen). Also nimmt man dann an, dass es ein "natürlicher" Ausreißer ist und dies eben vorkommt? Oder sagt man generell, über einer Größe von 3 bei den ZResid werden die generell rausgeschmissen? Oder man kann das Modell dann einfach nicht berechnen? Oder kommt es auf die Gesamtprobandenzahl an?

Viele Grüße

Re: Logistische Regression/ Verletzung Voraussetzung Ausreiß

BeitragVerfasst: Mi 12. Feb 2020, 09:01
von bele
Hallo Gianni,

da gibt es leider keine einfache Lösung. Du musst überlegen, wozu die Studie gut ist, was sie erreichen soll, ob der mögliche Fehler bei Beibehaltung dieser Person schlimmer ist oder bei Herauswerfen dieser Person. Im schlimmsten Fall musst Du alle Analysen mit und ohne diese Person rechnen und diskutieren. Da kommt es nun wirklich auf den Kontext und den kritischen Geist an. Der Leser Deiner Studie muss wissen, dass das präsentierte Ergebnis, obwohl keiner kleinen Studie entspringend, von einem einzigen Teilnehmer abhängt. Eine dritte Möglichkeit neben Rausschmeißen und Drinlassen wäre eine sogenannte "robuste Regression", die Ausreißer nicht rausschmeißt aber weniger gravierend berücksichtigt.

LG,
Bernhard

Re: Logistische Regression/ Verletzung Voraussetzung Ausreiß

BeitragVerfasst: Di 18. Feb 2020, 13:21
von Gianni_LL
Hallo Bernhard,
du meinst also bootstrapping durchführen? Ich habe es bisher immer so verstanden, dass bootstrapping eher bei der Verletzung der Normalverteilung angewendet wird. Oder gilt das auch für Verletzungen der Residuenanalyse , Ausreißer?

Danke!

Re: Logistische Regression/ Verletzung Voraussetzung Ausreiß

BeitragVerfasst: Di 18. Feb 2020, 13:49
von bele
Hallo Gianni,

nein, an Bootstrapping habe ich nicht gedacht. Ich habe primär vorgeschlagen, die Analysen alle doppelt zu rechnen, weil das ehrlich kommuniziert, wie groß die Bedeutung dieses einen Falls ist und die Zwickmühle, in der Du steckst, damit ehrlich kommuniziert wird.

Wenn Dir der Name Robuste Regression nichts sagt, dann ist die Gefahr groß, dass Sie auch den Lesern Deiner Arbeit nichts sagt und dann ist das eben kommunikativ schwierig. Nichtsdestoweniger gibt es neben ordinary least squares Regressionen auch noch Abwandlungen, die weniger empfindlich auf Ausreißer reagieren.
Vielleicht ein erster Appetithappen, wenn auch R-lastig und zu kurz: http://www.alastairsanderson.com/R/tuto ... sion-in-R/
Vielleicht ist das hier ein erster ernsthafter Leseeinstieg: https://en.wikipedia.org/wiki/Robust_regression
oder, wenn etwas mehr Zeit für den ernthaften Leseeinstieg ist, vielleicht https://cran.r-project.org/web/packages ... s/WRS2.pdf

LG,
Bernhard

Re: Logistische Regression/ Verletzung Voraussetzung Ausreiß

BeitragVerfasst: Di 18. Feb 2020, 13:59
von Gianni_LL
Hallo Bernhard,
vielen Dank dir für deine Literaturtipps. Leider beherrsche ich nur SPSS und werde für meine Abschlussarbeit auch keine Zeit mehr haben mich dafür in ein neues Programm (wie z.B. R) selbst einzuarbeiten. Aber ich werde mir die Literatur einmal durchlesen.
Vielen Dank auf jedenfall! :)

Viele Grüße

Re: Logistische Regression/ Verletzung Voraussetzung Ausreiß

BeitragVerfasst: Di 18. Feb 2020, 17:14
von bele
Das kann ich gut verstehen, zumal es mit "alles Berechnungen sowohl mit als auch ohne Ausreißer rechnen" ja eine gute, wenn nicht die bessere, Alternative gibt. Falls Du die Arbeit mündlich verteidigen musst, ist es sicher nicht falsch, auch über andere Alternativen nachgedacht zu haben.

LG,
Bernhard