Shapiro-Wilk

Fragen, die sich auf kein spezielles Verfahren beziehen.

Shapiro-Wilk

Beitragvon k73kgh » Do 16. Okt 2014, 17:40

Hallo,

ich arbeite gerade an (naturwissenschaftlich-technischen) Verteilungen, die durch grafische Methoden offensichtlich als "normalverteilt" angesehen werden können. Sowohl Q-Q-Plots, Box-Plots als auch Curve-Fits an das Histogarmm lassen diesen Schluss zu.

Um das ganze etwas "objektiver" zu gestalten, arbeite ich noch statistische Signifikanztests. Hier habe ich ein "Problem".

Wenn ich 5000 Beobachtungen mit dem Shapiro-Wilk Test untersuche, so wird die Nullhypothese für einen Großteil der Verteilungen verworfen. Reduziere ich die Anzahl an Beobachtungen (beispielsweise auf 1000), so trifft die Nullhypothese für einen Großteil der Verteilungen zu.
Daher meine Fragen:

1.) Woran liegt das?
2.) Gibt es Empfehlungen zur Anzahl an untersuchten Beobachtungen?

Grüße,
k73kgh
k73kgh
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 16. Okt 2014, 17:30
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Shapiro-Wilk

Beitragvon PonderStibbons » Do 16. Okt 2014, 19:46

Es wird getestet, ob die Stichprobendaten aus einer Population stammen,
die EXAKT normalverteilt ist. Die Hypothese, dass die Grundgesamtheit
EXAKT normalverteilt ist, lässt sich bei sehr großen Stichproben leicht
zurückweisen, selbst wenn die Abweichung vernachlässigbar gering ist
(geringer Standardfehler, hohe statistische power/Trenschärfe).

Es stellt sich die Frage, ob die getestete Nullhypothese (EXAKTE
Normalverteilung) tatsächlich sodnerlich interessant ist. Häufig
- gerade bei großen Stichproben - lässt sich anhand grafischer
Methoden beurteilen, ob die Verteilung akzeptabel der erwarteten
Verteilung folgt.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11264
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

Re: Shapiro-Wilk

Beitragvon k73kgh » So 19. Okt 2014, 21:52

Vielen Dank für die Antwort!

Die Ergebnisse meiner grafischen Methoden deuten auf Normalverteilungen hin. So wie ich Ihre Aussage verstanden habe, soll ich mich nicht auf primär auf die statistischen Signifikanztests stützen, da bereits geringe Abweichungen meiner Stichprobendaten von der EXAKTEN Normalverteilung (Ausreißer, Schiefe, Kurtosis, etc.) zu der Verwerfung der Nullhypothese führen können? Oder anders ausgedrückt: Die Aussagekraft der grafischen Methoden ist in diesem Fall vielleicht sogar höher?

Beste Grüße
k73kgh
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 16. Okt 2014, 17:30
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Shapiro-Wilk

Beitragvon bele » So 19. Okt 2014, 22:29

Wenn man bei den grafischen Methoden ehrlich bleibt, dann lautet die Antwort: Ja.
Natürlich kann sich jeder über jede Kurve beugen und sagen, dass sei eine Gerade. Aber die Signifikanztests haben größere Probleme.

MfG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5779
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1357 mal in 1344 Posts

Re: Shapiro-Wilk

Beitragvon k73kgh » Mo 20. Okt 2014, 09:38

Gut, danke für die Aussage.

Was sollte man in einer wissenschaftlichen Arbeit bei Signifkanztests angeben? Ich habe bislang:

- Signifikanzniveau
- p-Wert
- die jeweilige Entscheidung
- Anzahl der betrachteten Beobachtungen
k73kgh
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 16. Okt 2014, 17:30
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Shapiro-Wilk

Beitragvon bele » Mo 20. Okt 2014, 12:31

Hallo,

dazu gibt es unterschiedliche Traditionen in unterschiedlichen Gebieten und es hängt sicher auch von der ARt der Veröffentlichung ab (in einem Zeitschriftenartikel ausführlicher als in einem Vortrag, in einer Metaanalyse ausführlicher als in einem Bericht über einige Fälle).

In der Medizin würde das oft so reichen (plus Software und Versionsnummer, warum auch immer). In der Psychologie, habe ich mir sagen lassen, gehöre auch ein Effektstärkemaß regelmäßig dazu. Das lässt sich also ganz global nicht beantworten. Schau Dir vergleichbare Publikationen (hinsichtlich Fachgebiet und "Anspruch/Niveau") an. Im Zweifel immer lieber etwas zuviel, was der Reviewer streichen kann als zu wenig, was die Reviewer argwöhnisch werden lässt. Persönlich mag ich gut gemachte Grafiken mit den Rohdaten, es gibt aber auch Zeitschriften die es nicht mögen, wenn Daten sowohl als Tabelle als auch als Grafik erscheinen (kann ich selbst nicht nachvollziehen, aber Papier scheint sehr teuer zu sein).

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5779
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1357 mal in 1344 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot], Google [Bot] und 2 Gäste