Kolmogorov-Smirnov

Kolmogorov-Smirnov

Beitragvon hcbfei » Do 29. Aug 2019, 17:55

Hallo,

ich möchte Daten mit dem Kolmogorov-Smirnov-Test auf Normalverteilung testen (mit PSPP).

Ich habe N = 45 und als Ergebnis
Größte Differenz absolut: 0,9
Kolmogorov-Smirnov Z: 0,63
Asymp. Sign.: 0,829

Auf welche Werte muss ich jetzt genau schauen?
Ich hätte gesagt, dass die Grenze für die größte Differenz bei einer Probengröße von 45 bei etwa 0.2 liegen sollte, und die Signifikanz ist größer als 0.05, das heißt die Werte sind normalverteilt? Kann ich das so hinnehmen? Und auf was von beidem sollte man eher gucken bzw. was mache ich, wenn die sich quasi gegenseitig aushebeln?

Eine schnelle Antwort würde mir helfen, danke.
hcbfei
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 29. Aug 2019, 17:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Kolmogorov-Smirnov

Beitragvon PonderStibbons » Do 29. Aug 2019, 19:39

das heißt die Werte sind normalverteilt?

Es geht bei dem test nicht um die Werte in der Stichprobe, sondern um die Frage,
wie die Variable in der Grundgesamtheit verteilt sein mag. Deswegen ein
inferenzstatistischer Test. Die Nullhypothese ("Daten stammen aus einer
normalverteilten Grundgesamtheit") konnte nicht verworfen werden. Daraus
zu schließen, dass die Daten tatsächlich aus einer normalverteilten Grundgesamtheit
stammen, wäre etwas weit gegriffen bei der geringen power des Tests mit
gerade mal n=45. Ein Kolgomoriv-Smirnov mit der Nullyhypothese "die Daten
entstammen einer Lognormalverteilung" könnte eventuell ebenso zu einem
p > 0,05 führen, ohne dass das etwas aussagen würde.

Wieso testest Du das überhaupt, die etwaige "Normal"-Verteilung einer Variable
in der Grundgesamtheit ist in der Regel doch völlig uninteressant und irrelevant.

Mit freundlichen Grüßen

PonderStibbons
"Multiple exclamation marks are a sure sign of a diseased mind." (Terry Pratchett, 'Eric').
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 8054
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 25
Danke bekommen: 1651 mal in 1638 Posts

Re: Kolmogorov-Smirnov

Beitragvon hcbfei » Do 29. Aug 2019, 20:13

Hallo,
danke erst mal für die Antwort.

Es handelt sich bei der vorliegenden Stichprobe um Körpergrößen; laut meiner Dozentin sind die Daten in der Stichprobe normalverteilt, was als Voraussetzung für den t-Test geprüft wurde, und ich wollte das für mich verifizieren. Ich habe aber nicht ganz verstanden, wie sie anhand der oben genannten Ergebnisse die Aussage getroffen hat, dass eine Normalverteilung vorliegt.

Und warum kann ich damit nur testen, wie die Variable in der Grundgesamtheit verteilt ist? Meine Daten weisen für sich ja auch einen Verteilungstypen auf, und wenn sich die meisten Daten um den Mittelwert herum befinden kann ich davon sprechen, dass das die Stichprobe normalverteilt ist, oder? Geht es dabei nicht nur um die "Form" der Datenverteilung?

Liebe Grüße
hcbfei
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 29. Aug 2019, 17:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Kolmogorov-Smirnov

Beitragvon hcbfei » Do 29. Aug 2019, 20:20

Also es geht hier eigentlich nur um eine Übung, ob das jetzt in der wissenschaftlichen Praxis mit N = 45 so angewendet werden würde, ist natürlich eine andere Frage, es geht einfach nur ums Prinzip.
hcbfei
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 29. Aug 2019, 17:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Kolmogorov-Smirnov

Beitragvon PonderStibbons » Do 29. Aug 2019, 20:41

Es handelt sich bei der vorliegenden Stichprobe um Körpergrößen; laut meiner Dozentin sind die Daten in der Stichprobe normalverteilt,

Ich gehe von einem Missverständnis aus. Dass n=45 Stichprobenwerte exakt normalverteilt wären, kann niemand
ernsthaft annehmen. Allenfalls kann jemand behaupten, dass Körpergrößen in der Grundgesamtheit, aus der
die 45 Datenpunkte stammen, normalverteilt seien (was sie sicherlich auch nicht sind, aber eventuell annähernd).
was als Voraussetzung für den t-Test geprüft wurde,

Die Voraussetzung für den t-Test ist, dass die Grundgesamtheiten in jeder der beiden zu vergleichenden
Stichproben normalverteilt sind. Die Voraussetzung ist NICHT, dass die Variable in der Gesamtgruppe aus
einer normalverteilten Grundgesamtheit stammt.

Aber selbst die Annahme, dass jede der beiden Gruppen für sich in der Grundgesamtheit normalverteilt ist,
wäre nur für kleine Stichproben (n < 30) von Belang. Bei n=45 gilt der t-Test als robust gegen
nicht-normalverteilte Grundgesamtheiten.
und ich wollte das für mich verifizieren. Ich habe aber nicht ganz verstanden, wie sie anhand der oben genannten Ergebnisse die Aussage getroffen hat, dass eine Normalverteilung vorliegt.

Man kann diese Aussage nicht treffen. Man kann allenfalls die Aussage treffen, dass
sich die Hypothese einer normalverteilten Grundgesamtheit nicht verwerfen lässt.
Das ist keinesfalls dasselbe wie die Aussage, dass diese Hypothese zutrifft.

Und warum kann ich damit nur testen, wie die Variable in der Grundgesamtheit verteilt ist?

Weil es ein inferenzstatistischer Test ist. Inferenzstatistische Tests behandeln die Frage,
wie wahrscheinlich die vorliegenden Stichproben-Daten wären, wenn man eine
bestimmte Nullhypothese annimmt. Die Nullhypothese ist hier: In der Grundgesamtheit
ist die Variable normalverteilt. Die Daten reichen nicht aus, diese Hypothese zu
verwerfen. Nicht-Verwerfen-können (z.B. mangels ausreichend vielen Daten)
ist aber nicht gleich "die Hypothese stimmt".

Was für den t-Test aus den oben genannten Gründen aber sowieso gleich zweifach
irrelevant wäre.

Meine Daten weisen für sich ja auch einen Verteilungstypen auf, und wenn sich die meisten Daten um den Mittelwert herum befinden kann ich davon sprechen, dass das die Stichprobe normalverteilt ist, oder?

Wenn Du das möchtest, dann mach das. Es berührt das Problem nicht. Die Voraussetzungen
des t-Tests befassen sich mit den Grundgesamtheiten, aus denen die Daten stammen, nicht
mit der Verteilung der Daten in den Stichproben.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 8054
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 25
Danke bekommen: 1651 mal in 1638 Posts

folgende User möchten sich bei PonderStibbons bedanken:
hcbfei

Re: Kolmogorov-Smirnov

Beitragvon hcbfei » Do 29. Aug 2019, 20:58

Danke für die Antwort.

Wie gesagt, das Ganze erfüllte auch nur Demonstrationszwecke, dass 45 Daten zu wenige für exakte Aussagen sind, ist mir klar.

Ich kann es jetzt auch nur so wiedergeben, wie sie es in unserem Kurs gemacht haben; wir haben verschiedene Körperparamter gemessen, also Größe, Gewicht etc., jeweils männlich und weiblich, und uns wurde eine Auswertung zur Verfügung gestellt, in der für etwa die Hälfte der gemessenen Variablen stand "normalverteilt, t-Test" und bei der anderen Hälfte "nicht normalverteilt, Whitney-U-Test".
Das sollte halt das prinzipielle Vorgehen bei der Datenanalyse veranschaulichen, warum sie dann nicht für alle den t-Test gemacht haben, wenn das bei größeren Stichproben egal ist, weiß ich auch nicht.
hcbfei
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 29. Aug 2019, 17:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Kolmogorov-Smirnov

Beitragvon PonderStibbons » Do 29. Aug 2019, 22:19

Wie gesagt, das Ganze erfüllte auch nur Demonstrationszwecke, dass 45 Daten zu wenige für exakte Aussagen sind, ist mir klar.

Das ist allerdings nicht das Thema, sondern präzise welche Voraussetzungen für den t-Test gelten.
Ich kann es jetzt auch nur so wiedergeben, wie sie es in unserem Kurs gemacht haben; wir haben verschiedene Körperparamter gemessen, also Größe, Gewicht etc., jeweils männlich und weiblich, und uns wurde eine Auswertung zur Verfügung gestellt, in der für etwa die Hälfte der gemessenen Variablen stand "normalverteilt, t-Test" und bei der anderen Hälfte "nicht normalverteilt, Whitney-U-Test".

Ja, das ist leider ein immer noch verbreiteter Unfug. Aber wenn es bei Euch
so Vorschrift ist, dann teste halt die Gesamtgruppe statt der einzelnen Gruppen,
und da in Deinem Beispiel p > 0,05 (oder was immer die Vorgabe für die
Signifikanzschwelle ist), darfst Du entsprechend der Vorgaben einen t-Test
rechnen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 8054
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 25
Danke bekommen: 1651 mal in 1638 Posts

folgende User möchten sich bei PonderStibbons bedanken:
hcbfei


Zurück zu Nichtparametrische Tests

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron