Ausreißer ermitteln und entfernen

Fragen, die sich auf kein spezielles Verfahren beziehen.

Ausreißer ermitteln und entfernen

Beitragvon yoloman » Fr 3. Jun 2016, 01:01

Hallo liebe Community,

mag mir jemand erklären, wie ich Ausreißer ermitteln und anschließend mit SPSS löschen kann?

Mein Model: moderierte Mediation mit zwei Mediatoren und zwei AV's (also 2x2 moderierte Mediation).
- 2 unabhängige Variablen (beide nominal: arm vs. reich / privat vs. öffentlich). Wobei einer der UV als Pseudo-Moderator gilt.
- 2 Mediatoren
- 2 abhängige Variablen
- 4 Kontrollvariablen
- Stichprobengröße N = 430


Meine Fragen:
1.) Wie wird hier der Ausreißer ermittelt?
- Sollen beide UV's (beide nominale Variablen) in SPSS unter Analysieren>Regression>Linear und eine der AV (welche aber, oder abwechselnd beide?) eingetragen werden?
- Unter "Speichern" wähle ich z.B. die Mahalonibis-Distanz, Cook, Hebelwerte aus - soweit richtig?
- Ich erhalte bei diesen Einstellungen eigentlich nur 4 verschiedene Werte bei den Mahalonobis und Hebelwerten (ein Wert pro 2x2 Szernario) - ist das korrekt?

2.) Ausschluss
- Gibt es einen Konsens (Literaturhinweis?), ab welchem Wert eine Person gelöscht werden soll?
- Wie wird die Person mit einem Ausreißerwert gelöscht?

Vielen Dank für eure Hilfe :)
yoloman
Mitglied
Mitglied
 
Beiträge: 24
Registriert: Do 7. Jan 2016, 18:20
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Ausreißer ermitteln und entfernen

Beitragvon bele » Fr 3. Jun 2016, 07:59

Hallo yoloman,

zu Deinen SPSS-Fragen kann ich leider nichts beitragen.

yoloman hat geschrieben:- Gibt es einen Konsens (Literaturhinweis?), ab welchem Wert eine Person gelöscht werden soll?


Ich hab in einem anderen Thread mal was zum Thema Ausreißerentfernung geschrieben und bin so frei, das hier einfach nochmal hin zu kopieren.

HTH & LG,
Bernhard
Extreme Werte können unsinnig entstandene Werte sein (Messwert falsch auf den Erhebungsbogen übertragen) oder das Ergebnis einer tatsächlichen Streuung der Messgröße sein. In Fukushima hatte man Mauern gegen 5,5m hohe Wellen gebaut. Dann kam die 10m hohe Welle. Sie war ein Extremwert, aber einer, den das Meer tatsächlich produziert hat. Die 10m Welle war real und es wäre verfälschend, sie aus den Archiven streichen zu wollen. Hätte aber jemand versehentlich eine 10cm Welle als 10m Welle dokumentiert, dann müsste man diesen offensichlich falschen Wert aus den Messungen streichen. Das hat gar nichts damit zu tun, welchen z-Wert eine 10m-Welle vor Fukushima hat.

Es muss also um die Frage gehen, wie es am wahrscheinlichsten zu den extremen Werten gekommen ist und ob man den kleineren Fehler macht, wenn man sie streicht oder ob man den kleineren Fehler macht, wenn man sie drin lässt (eine zu hohe Mauer für Fukushima wäre teuer gewesen. Eine zu niedrige war fatal). Ohne Sachkunde in Ozeanographie, Hydrologie, Physik und Katastrophenschutz lässt sich die Frage nach der angemessenen Mauerhöhe nicht beantworten. Auch wir werden Deine Frage nicht beantworten können, ohne die Hintergründe genauestens zu kennen. Ohne sachwissenschaftlichen Hintergrund kann man Dir da nicht anständig raten.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5776
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1356 mal in 1343 Posts

Re: Ausreißer ermitteln und entfernen

Beitragvon PonderStibbons » Fr 3. Jun 2016, 08:51

- Gibt es einen Konsens (Literaturhinweis?), ab welchem Wert eine Person gelöscht werden soll?

Konsens wäre "Gar nicht", bzw. nur wenn es sich um einen Eingabefehler handelt.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11260
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

Re: Ausreißer ermitteln und entfernen

Beitragvon yoloman » Fr 3. Jun 2016, 10:48

Hallo ihr beiden,

danke für die Antwort und Einblicke in die vernunftsorientierte Statistik.

Allerdings kann & darf ich nicht so argumentieren. Leider wird das wohl in der Psychologie sehr gerne gesehen, dass man sich stets um die Ausreißerwerte kümmert. Gerade weil Antworten oft durch Anreize (z.B. Amazon-Gutschein) oder Erhaltung von Versuchspersonenstunden der Stunden (hauptsache schnell erledigen) verzerrt werden.

So sehe ich meinem Datensatz, dass es Personen gibt, die entweder einseitig geklickt haben (z.B. nur den einen Extremwert bei allen Variablen) oder für einen 15-20 minütigen Fragebogen nur 1-2 Minuten gebraucht haben.

Als elegante Lösung wollte ich daher eine Identifikation und Lösung der Ausreißer ermitteln.

Gibt es hierzu doch noch eine Lösung? :)
yoloman
Mitglied
Mitglied
 
Beiträge: 24
Registriert: Do 7. Jan 2016, 18:20
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Ausreißer ermitteln und entfernen

Beitragvon PonderStibbons » Fr 3. Jun 2016, 11:03

Allerdings kann & darf ich nicht so argumentieren. Leider wird das wohl in der Psychologie sehr gerne gesehen, dass man sich stets um die Ausreißerwerte kümmert.

Kann ich so nicht unterschreiben. Wer hat Dir konkret die Vorgabe gemacht?
Gerade weil Antworten oft durch Anreize (z.B. Amazon-Gutschein) oder Erhaltung von Versuchspersonenstunden der Stunden (hauptsache schnell erledigen) verzerrt werden.

Das sind doch keine statistischen Ausreißer.
So sehe ich meinem Datensatz, dass es Personen gibt, die entweder einseitig geklickt haben (z.B. nur den einen Extremwert bei allen Variablen) oder für einen 15-20 minütigen Fragebogen nur 1-2 Minuten gebraucht haben.

Das sind auch keine statistischen Ausreißer, auf die sich Deine initialen Fragen beziehen.
Das sind schlicht Fragen des Untersuchungsdesigns, welche Reaktionen als gültig im Sinne
der Studie anzusehen sind und was nicht. Insofern besteht kein Dissenz zwischen den
Antworten, die Du erhalten hast, und dem was Du jetzt schilderst.

Als elegante Lösung wollte ich daher eine Identifikation und Lösung der Ausreißer ermitteln.

Das wäre nicht elegant, sondern der Versuch einer "statistischen" Lösung für ein
nicht-statistisches Problem.
Gibt es hierzu doch noch eine Lösung?

S.o. Du definierst sachorientiert und nachvollziehbar, welche Messungen dem Studienprotokoll
entsprechen und welche nicht.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11260
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

Re: Ausreißer ermitteln und entfernen

Beitragvon yoloman » Fr 3. Jun 2016, 11:25

Hallo lieber PonderStibbons,

danke für deine schnelle Antwort!

1.) Die Aussagen habe ich so aus den Vorlesungen mitgenommen - Ausreißerwerte sind stets zu untersuchen und zu eliminieren
2.) Wie werden sonst Personen gewertet, die nur wegen des Gutscheins bzw. Erhaltung von Versuchspersonenstunden (Studenten) meine Studie sich durchgeklickt haben? Ich habe aufgrund dessen Personen, die nur einen extremen Wert in der Skala angeklickt habe (trotz Polung!), um ihre Belohnung abzuholen.
3.) Ist es kein statistisches Problem, wenn Personen in den Fragebogen gelangen und sich nur mit einer Antwortlösung durchklicken? Handelt es sich nicht hier um einen Extremfall?
yoloman
Mitglied
Mitglied
 
Beiträge: 24
Registriert: Do 7. Jan 2016, 18:20
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Ausreißer ermitteln und entfernen

Beitragvon bele » Fr 3. Jun 2016, 11:42

Hallo yoloman,

yoloman hat geschrieben:1.) Die Aussagen habe ich so aus den Vorlesungen mitgenommen - Ausreißerwerte sind stets zu untersuchen und zu eliminieren

Wir werden uns alle ganz schnell einig, dass Ausreißer untersucht werden sollten. Sie generell in jeder Auswertung zu eliminieren ist nicht vertretbar. Vielleicht hat Euer Prof gesagt, dass man die Statistik auch immer noch einmal ohne die Ausreißer rechnen sollte, um einen Eindruck von deren Bedeutung für das Endergebnis abzuschätzen oder ähnliches. Es gibt jedenfalls nicht die eine, universell akzeptierte Antwort darauf, was genau ein Ausreißer ist.

yoloman hat geschrieben:2.) Wie werden sonst Personen gewertet, die nur wegen des Gutscheins bzw. Erhaltung von Versuchspersonenstunden (Studenten) meine Studie sich durchgeklickt haben? Ich habe aufgrund dessen Personen, die nur einen extremen Wert in der Skala angeklickt habe (trotz Polung!), um ihre Belohnung abzuholen.

Wenn Du als Psychologe argumentierst, dass Personen mit diesem Ankreuzverhalten nicht in die Auswertung einfließen sollen, dann ist das eine sachwissenschaftliche Erwägung, der die statistische Auswertung sich unterzuordnen hat. Es ist aber Dein psychologischer Sachverstand, der sagt: Alle ganz rechts trotz unterschiedlicher Polung ist nicht plausibel und fliegt raus. Statistik wird erst nach dieser Entscheidung gerechnet.

3.) Ist es kein statistisches Problem, wenn Personen in den Fragebogen gelangen und sich nur mit einer Antwortlösung durchklicken? Handelt es sich nicht hier um einen Extremfall?

Statistisch rechnen lässt sich das mit und ohne Extremfälle. Die Frage lautet doch, wann ist die Statistik inhaltlich plausibler zu interpretieren, mit oder ohne die Extremfälle. Wann sagt die Stichprobe inhaltlich mehr über die zu untersuchende Grundgesamtheit aus.

Ich kann das gut verstehen, dass Du diese Fälle herausschmeißen willst und wenn Du das gut begründen kannst, dann schmeiß sie raus. Aber die Begründung versteckt sich nicht in irgendeinem SPSS-Menü. Die musst Du psychologisch argumentieren.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5776
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1356 mal in 1343 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast