Diese Fälle ausschließen?

Alle Verfahren der Regressionanalyse.

Diese Fälle ausschließen?

Beitragvon Otja » Di 19. Jun 2018, 12:47

Hallo liebes Statistik Team,

ich habe eine kleine Frage.
Ich weiß, wenn Residuen (also die AVs, richtig?) bestimmte Kriterien nicht erfüllen,
dann muss ich sie als Ausreißer deklarieren und ausschließen.
z.B wenn Werte mehr als 3 Standardabweichungen entfernt sind.
Wie ist das wenn ich Extremwerte im Prädiktor habe?
Dürfen die bleiben?

Ich habe einen Fall, der bei Mittelwert 6,56 und Standardabweichung ~14
den Stolzen Wert von 156 erreicht.

Darüber hinaus:
3 SD wäre ~48; 1,9% der Fälle liegen darüber (n = 7), wobei der vorletzte Wert bei 89 liegt.
Der 156er steht also wirklich alleine auf weiter Flur.

Lasse ich das jetzt so, oder muss ich da Fälle Ausschließen?

Vielen Dank. :)
Otja
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Do 17. Mai 2018, 11:41
Danke gegeben: 9
Danke bekommen: 0 mal in 0 Post

Re: Diese Fälle ausschließen?

Beitragvon PonderStibbons » Di 19. Jun 2018, 13:00

Hallo liebes Statistik Team

Das ist hier auf Basis des Freizeitvergnügens Einzelner, keine professionelle Dienstleistung eines Teams.
Ich weiß, wenn Residuen (also die AVs, richtig?)

Nein, leider nicht. Was Residuen in einer Regression bzw. Varianzanalyse sind, lässt sich aber ganz schnell recherchieren, vermute ich.
dann muss ich sie als Ausreißer deklarieren und ausschließen.

Man "muss" sie nicht als Ausreißer deklarieren. Man muss sie nicht aufgrund eines fixen Kriteriums als Ausreißer deklarieren. Und Ausschluß ist erst recht kein Automatismus, sondern im Gegenteil stets heikel. Sofern es sich nicht um einen Erhebungs- oder Eingabefehler handelt, versteht sich.
Ich habe einen Fall, der bei Mittelwert 6,56 und Standardabweichung ~14
den Stolzen Wert von 156 erreicht.

Da man nicht weiß, um was es sich bei dieser Variable handelt, ist das nicht kommentierbar.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Otja

Re: Diese Fälle ausschließen?

Beitragvon Otja » Di 19. Jun 2018, 16:24

Hallo PonderStibbons,

Als außenstehende nehme ich euch/dich,
das heißt die Personen die hier so lieb sind Fragen zu beantworten,
als Team war.
Ich sehe euch nicht als Dienstleister oder so.

Ich hatte dann, wie du ja richtig angemerkt hast,
zu Residuen nachgelesen und gesehen, dass ich das ganz falsch verstanden hatte.
Vor dem Hintergrund macht mein erster Post auch garkeinen Sinn mehr.
Ich stelle die Frage später noch einmal richtig.

Vielen Dank für die schnelle Antwort.

Liebe Grüße,
Otja.
Otja
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Do 17. Mai 2018, 11:41
Danke gegeben: 9
Danke bekommen: 0 mal in 0 Post

Untersuchung nach Ausreißern

Beitragvon Otja » So 24. Jun 2018, 22:12

Hallo ihr Lieben, Hallo PonderStibbons,

also ich will auf Ausreißer testen und habe mich jetzt länger mit dem betreffenden Abschnitt in diesem Text befasst:
https://www.uni-trier.de/fileadmin/urt/ ... linreg.pdf

und hatte auf der einen und der anderen Internetseite gelesen.
z.B. https://statistikguru.de/spss/multiple- ... isser.html

So wie ich das sehe kann ich:
1 - Ausreißer anhand der Residuen (z.B. größer als 3SD) in SPSS versuchsweise ausschließen lassen (was eine Bessere Modellpassung ergeben sollte)
2 - das gleiche für Studentisierte ausgeschlossene Residuen ansehen
3 - die Hebelwerte untersuchen (im Zusammenhang zu den Residuen)
4 - Cook-Distanzen untersuchen

Kontext noch - es geht mir dabei nicht um die Suche nach Eingabefehlern,
sondern nach auffälligen Fällen.

Wenn ich meine Daten untersuche sollte ich mir, dass dann immer 1 zu 4 in der Reihnfolge ansehen?
So wie ich das verstanden habe kann ich dann sicher einen Fall ausschließen,
wenn er auf mehreren der 4 Ebenen als Ausreißer bestimmt wird.
Gleichzeitig würde (so ich es in dem ersten Text gelesen habe) ein gutes Residuum bei schlechten Cook Werten bedeuten,
dass ich den Fall doch drin behalte - richtig?

Wenn ich die Hebelwerte betrachte steht in dem Text:
Fälle mit extremen Werten bei unabhängigen Variablen verfügen über einen starken Einfluss auf die
Schätz- und Testergebnisse, wenn ihr Residuum relevant von null abweicht. Man spricht hier von einer
starken Hebelwirkung. [...]
[es folgt eine Berechnung von Hebelwerten und ein Vergleich mit der Stichprobe. Ein paar Werte übersteigen den kritischen Hebelwert.]
Ob diese Städte tatsächlich einen unangemessen starken Einfluss auf
die Schätzergebnisse haben, hängt von ihrem Residuum ab.


Ab wann weicht etwas relevant von Null ab?
Aber vor allem - "hängt von Ihrem Residuum ab" - von welchem wohl? Den rohen Residuen? Den Standartisierten/Studentisiert/ausgeschlossen Studentisiert?
Welche soll man da nehmen?
Ich habe auch nachgelesen, was die Kategorien Bedeuten - ich würde zu den studentisierten, ausgeschlossenen neigen, aber ich weiß es nicht.

Der Fall mit dem höchsten Hebelwert kommt bei mir auf 0.325 hat aber ein ausgelassen-studentisiertes Residuum von nur -0.00994
(und eine Cook-Distanz von 0.00002).
Der Kritische Hebelwert lautet dabei bei mir so: (2*k)/N = (2*1)/337 = 0,005934
Aus meiner Wahrnehmung weicht -0.00994 nicht relevant von 0 ab, also ist der Hebelwert auch egal, richtig?
Es heißt nur - Vorsicht, dieser Fall hat einen starken Einfluss auf das Modell.

Tut mir leid, dass es so lang geworden ist.

Vielen Dank. :)
Liebe Grüße,
Otja.
Otja
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Do 17. Mai 2018, 11:41
Danke gegeben: 9
Danke bekommen: 0 mal in 0 Post

Re: Diese Fälle ausschließen?

Beitragvon PonderStibbons » Mo 25. Jun 2018, 09:25

Anscheinend hast Du 1 auffälligen Fall. Da nicht beschrieben
wurde, um was es hier inhaltlich geht, schwer zu beurteilen.
Wenn Du mit und ohne diesen Fall rechnest und sich nicht
markant was an den Ergebnissen ändert, sollte es normalerweise
gut sein.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Otja

Re: Diese Fälle ausschließen?

Beitragvon bele » Mo 25. Jun 2018, 09:31

Hallo Otja,

alles, was ich hier gerne schreiben möchte, habe ich in meinen zwei Beiträgen in diesem Thread schon mal geschrieben, deshalb würde ich Dich bitten, den an dieser Stelle einmal zu lesen: post27901.html?#p27901

Alles, was Du da über formal-rechnerische Methoden in der Statistik schreibst ist ja richtig, ist aber nicht der Kern. Du rechnest diese Statistik, weil Du ein Ziel im echten Leben verfolgst und Du musst die Auswirkungen Deiner Löschentscheidung auf dieses Ziel im echten Leben prüfen und danach entscheiden. Im schlimmsten Fall muss man halt auch mal zwei komplette Auswertungen rechnen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5748
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1343 mal in 1330 Posts

folgende User möchten sich bei bele bedanken:
Otja


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste