Behandlung von Ausreissern

Fragen, die sich auf kein spezielles Verfahren beziehen.

Behandlung von Ausreissern

Beitragvon Elly » Do 12. Dez 2013, 09:00

Hallo,

ich habe eine Stichprobe von n=29. einerseits habe ich subj. Daten erhoben (fragebogen) und andererseits objektiv (messwiederholung: 2 MZP's). Die objektiven Daten wurden nun automat. mit einer Software ausgewertet. Diese Auswertung ist jedoch bei n=6 unlogisch (validität der software soll nicht überprüft werden). Meine frage ist nun, muss ich die 6 "ausreisser" von allen stat. Berechnungen ausschliessen oder nur, wenn ich berechnungen mit objekt. Daten mache. Objekte daten n=23, subj. D. =n=29. ein vergleich dürfte ich dann aber nicht ziehen, oder? Oder überhaupt nicht ausschliessen, weil n eh schon sehr klein ist? Und dies so begründen?

Wäre über eine Antwort sehr dankbar, weil ich echt nicht weisd, was ich tun soll!!!

Gruss,
Elly
Elly
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 12. Dez 2013, 08:50
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Behandlung von Ausreissern

Beitragvon Elly » Do 12. Dez 2013, 09:14

Vielleicht muss ich noch präzisieren: bei 3 von den 6 von mir als Ausreisser betitelten probanden fehlen die obj. Daten gänzlich, die anderen 3 sind aufgrund der auswertung mit der software unlogisch.

Danke für eine Antwort!
Elly
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 12. Dez 2013, 08:50
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Behandlung von Ausreissern

Beitragvon PonderStibbons » Do 12. Dez 2013, 17:49

Worum geht es in der Studie konkret, und was konkret wurde gemessen?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11261
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

Re: Behandlung von Ausreissern

Beitragvon Andiego » Fr 13. Dez 2013, 11:09

Hallo Elly,

aus deinem Anfangspost geht mir nicht ganz hervor, was das Problem ist. Trotzdem versuche ich es mal so zu formulieren: Wenn du Fälle hast, die nicht plausibel sind, dann eliminierst du sie aus deinem Datenset.
Ob du die ganzen Fälle eliminierst, oder nur die Variablen, für die keine plausiblen Daten vorliegen, lässt sich nicht eindeutig beantworten. Ich würde die Fälle behalten, wenn ich die Daten unbedingt benötige. Ansonsten komplett raus.
Vielleicht solltest du dir überlegen, wie du deine Entscheidung anschließend begründest. Argumente lassen sich für beide Varianten finden, insofern ist deine Ausgangslage nicht die schlechteste ;)

Ich hoffe das hilft ein wenig.

Beste Grüße!
Andiego
Beobachter
Beobachter
 
Beiträge: 19
Registriert: Mo 22. Apr 2013, 16:54
Danke gegeben: 2
Danke bekommen: 2 mal in 2 Posts

Re: Behandlung von Ausreissern

Beitragvon PonderStibbons » Fr 13. Dez 2013, 11:35

Wenn du Fälle hast, die nicht plausibel sind, dann eliminierst du sie aus deinem Datenset.

So allgemein formuliert widerspricht das allerdings der guten Praxis in der
statistischen Analyse von Forschungsdaten diametral. Dort gilt nur die
Eliminierung von eindeutig fehlerhaften Daten als gerechtfertigt. Alles andere
wird sehr skrupulös gehandhabt, da die sonst die Verfälschung von
Datensätzen gerechtfertigt würde. "Plausibel" ist im Prozess des
Datenselektierens meist das, was den favorisierten Ergebnissen entspricht.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11261
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

Re: Behandlung von Ausreissern

Beitragvon Andiego » Fr 13. Dez 2013, 13:05

Hallo Ponder,

aus theoretischer Sicht hast du vollkommen recht. Habe ich es mit Daten zu tun, die ich nicht erklären kann, heißt es natürlich nicht, dass ich diese entfernen sollte.
In der Praxis sind solche explorative Plausibilitätskontrollen dennoch üblich, bei denen im Anschluss Daten entfernt werden. Ich sage mal vorsichtig, dass ich diesen Pragmatismus in vielen Fällen nachvollziehen kann.

Tatsächlich kann es zum Beispiel bei der Modellierung von Regressionen auch sehr Sinnvoll sein Fälle zu ignorieren. Auch wenn es zugegebenermaßen ein etwas anders gelagerter Fall sein mag :)
Andiego
Beobachter
Beobachter
 
Beiträge: 19
Registriert: Mo 22. Apr 2013, 16:54
Danke gegeben: 2
Danke bekommen: 2 mal in 2 Posts

Re: Behandlung von Ausreissern

Beitragvon PonderStibbons » Fr 13. Dez 2013, 14:10

aus theoretischer Sicht hast du vollkommen recht.

Das ist eine eher praktische Sicht. In klinischen Studien darf man es
ohnedies nicht nach Belieben machen, in Grundlagenstudien produziert
lässiger Umgang mit unerwünschten Daten unreplizierbare Befunde.
Natürlich spart das Streichen unerwünschter Daten oft Arbeit, aber
dann muss man ausblenden, dass man in Gefahr ist, Murks zu produzieren.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11261
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

Re: Behandlung von Ausreissern

Beitragvon Andiego » Fr 13. Dez 2013, 14:55

Um das noch nachzureichen: Das streichen von Fällen heißt nicht weniger Arbeit. Und eine Dokumentation über den Vorgang und eine Begründung darüber, warum man Ausreißer eliminiert, halte ich für unabdinglich.
Bspw.Clusteranalyse. Wenn der Silhouetten Koeffizient 0 ist, dann bringt es nichts, das Objekt einem Cluster zuzuordnen. Oder Regression. Wenn der Hebel eines Falles zu groß, dann sollte man darüber nachdenken, den Fall zu entfernen.
Andiego
Beobachter
Beobachter
 
Beiträge: 19
Registriert: Mo 22. Apr 2013, 16:54
Danke gegeben: 2
Danke bekommen: 2 mal in 2 Posts

Re: Behandlung von Ausreissern

Beitragvon Elly » Mo 16. Dez 2013, 07:08

Vielen Dank für eure Hilfe. Ich werde die Fälle nun eliminieren.
Elly
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 12. Dez 2013, 08:50
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Behandlung von Ausreissern

Beitragvon DHA3000 » Mo 16. Dez 2013, 10:55

Andiego hat geschrieben:Hallo Ponder,

aus theoretischer Sicht hast du vollkommen recht. Habe ich es mit Daten zu tun, die ich nicht erklären kann, heißt es natürlich nicht, dass ich diese entfernen sollte.
In der Praxis sind solche explorative Plausibilitätskontrollen dennoch üblich, bei denen im Anschluss Daten entfernt werden. Ich sage mal vorsichtig, dass ich diesen Pragmatismus in vielen Fällen nachvollziehen kann.

Tatsächlich kann es zum Beispiel bei der Modellierung von Regressionen auch sehr Sinnvoll sein Fälle zu ignorieren. Auch wenn es zugegebenermaßen ein etwas anders gelagerter Fall sein mag :)


Ehm, nein. Gerade bei Regressionsmodellen kann man entsprechende Techniken anwenden, um ein wenig mehr Klarheit zu haben.
Wo kommen wir denn bitteschön hin, wenn ich Daten, die nicht fehlerhaft sind, ich aber nicht erklären kann, einfach weglasse? Damit drehe ich mir doch automatisch mein Ergebnis zurecht. Keine Ahnung, wo du so etwas anwendest, aber das ist grob fahrlässig.

Abgesehen davon: Das Eliminieren dieser "Fälle" bei 29 Beobachtungen wird dazu führen, dass die Ergebnisse garnicht mehr interpretiert werden können.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Nächste

Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste