Ausreißertests

Univariate Statistik.

Ausreißertests

Beitragvon jos22 » Mi 13. Aug 2014, 17:57

Hallo,

hier mal eine Frage oder Anregung zu Ausreißertests.

Ausreißertests sollen einzelne Werte einer Stichprobe identifizieren, die nicht zu der Stichprobe gehören. Bspw. ein Messwert, bei dem die Messung fehlerhaft war, und deshalb das Ergebnis zu gering ist. Dabei wird dann angezweifelt, ob der Wert stimmen kann und es sich nicht um ein statistisch zufälliges Ergebnis handelt.

Zwei gerne zitierte Tests sind der Ausreißertest von Grubbs und von David-Hartley-Pearson.

Dazu mal zwei Wiki-Links:
http://de.wikipedia.org/wiki/David-Hartley-Pearson-Test
http://de.wikipedia.org/wiki/Ausrei%C3% ... ach_Grubbs

Die Funktionsweise ist gleich: Aus einer Stichprobe (x_1 bis x_n) werden entweder die Spannweite (x_n - x_1) (David-Hartley-Pearson) oder der absolute Abstand von Mittelwert zu vermuteten Ausreißer (Grubbs) ins Verhältnis zur Standardabweichung gesetzt. Dieser Kennwert wird mit einem Tabellenwert verglichen, um eine Aussage zum vermeintlichen Ausreißer zu treffen.

Frage ist nun: Wird der vermeintliche Ausreißer zur Berechnung des Mittelwertes und der Standardabweichung heran gezogen oder nicht. Die (Internet)-Literatur sagt hier: JA.
Es gibt aber auch Fälle, wo mit Berücksichtung des Ausreißers für die Standardabweichung der Ausreißer abgelehnt wird. Ohne die Berücksichtigung des Ausreißers sinkt die Standardabweichung signifikant und der Ausreißer wird erkannt.

Wenn man sich das mal anders vorstellt, habe ich eine Menge zweifelsfreie Messwerte, denen ich glaube. Dazu gehört ein Mittelwert und eine Standardabweichung (diese kann ich ggf. sogar mit der Standardabweichung alter Ergebnisse auf Validität abgleichen). Jetzt kommt ein zweifelhafter Messert dazu und verunreinigt meine Messdaten. Und eine Aussage ob Ausreißer oder nicht, soll man auf Grundlage dieser bereits verunreinigten Daten tun. Damit würde man sich im Zweifel selbst betrügen. Meiner Meinung nach sollte der vermeintliche Ausreißer nicht zur Berechnung der Standardabweichung herangezogen werden.

Ein weiterer merkwürdiger Fall ist der Schnelltest auf Normalverteilung nach DAVID. (das ist der David von David-Hartley-Pearson).
Auch hier wird die Spannweite der Messwerte einer Stichprobe ins Verhältnis zur Standardabweichung gesetzt. Dieses Verhältnis darf eine untere und eine obere Schranke nicht verletzten.

http://www.mathematik.uni-marburg.de/~l ... 0David.pdf

Die obere Schranke beim David-Schnelltest entspricht der Beurteilungsschranke nach David-Hartley-Pearson.

Folgenden Ablauf hat der Ausreißertest (bei Berücksichtigung aller Daten, auch des vermeintlichen Ausreißers):
1) Voraussetzung: Daten NV-verteilt: David-Schnelltest würde JA ergeben.
2) Ausreißertest nach DAVID-Hartley-Pearson wäre dann aber immer negativ, weil sonst der Schnelltest nach DAVID schon "angeschlagen" hätte.

Damit scheint mir das Konstrukt unsinnig.
Beide Tests in Kombination können meiner Meinung nur funktionieren, wenn der Ausreißer in der Bestimmung von Standardabweichung und Mittelwert nicht berücksichtigt wird. Weiterhin sollte der Ausreißer im David-Schnelltest auf NV nicht für die Berechnung der Spannweite verwendet werden.
Sind die restlichen, sauberen Daten normalverteilt, kann der Ausreißertest erfolgen: Eine Überschreitung der oberen Grenze bedeutet: große Spannweite bei verhältnismäßig kleiner Standardabweichung. Das tritt ein, wenn ein Einzelwert (Ausreißer) stark von dem restlichen weniger streuenden Werten abweicht.

Ich hoffe, man konnte meinen Ausführungen folgen und ich würde mich auf andere Meinungen/Anregungen zu dem Thema freuen.

Zuletzt muss ich zugeben, lediglich im Internet verfügbare Quellen benutzt zu haben, es kann also im Falle eines Fehlers sein, dass der eine vom Anderen abgeschrieben hat.
jos22
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Mi 13. Aug 2014, 17:22
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Zurück zu Mittelwert, Standardabweichung & Co.

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron