Welche stat. Verfahren bei n=22 nicht normalverteilt?

Fragen, die sich auf kein spezielles Verfahren beziehen.

Welche stat. Verfahren bei n=22 nicht normalverteilt?

Beitragvon srek » Mi 22. Apr 2015, 19:16

Hallo Forum, 

ich muss eine umfangreiche statistische Analyse für meine B.A. machen. Hatte nie Statistik im Studium und hab mich jetzt versucht da selbst reinzuarbeiten - mit vielen Fragen natürlich. Wenn mir einer von euch Experten weiterhelfen könnte wäre ich sehr sehr dankbar!!!

Zu meiner Stichprobe:
Ich habe eine Klasse mit 22 Schülern/Innen untersucht.

Zum einen deren kognitiven Fähigkeiten:
- Schulnoten in Mathe, Deutsch Englisch
- Mathetest: Rohwerte (Punkte), T-Werte anhand einer Normentabelle (Testergebnisse von anderen Klassen in Deutschland)
- Lesetest(Deutsch): Rohwerte (Punkte), Prozentrang und T-Werte anhand von Normentabelle
- Schreibtest(Deutsch):Rohwerte (Punkte), Prozentrang und T-Werte anhand von Normentabelle

Und deren sportliche Fähigkeiten:
- Motorik: Rohwerte von 5 Testverfahren(Sprint, Ausdauerlauf usw.)
- Sportaktivität: Rohwerte von Anzahl der Vereinsmitgliedschaften, Sport-AGs und jeweils wie oft teilgenommen wird.

Meine Hypothesen (stichpunktartig) sind:

1.)bessere motor. Leistungen bedeuten bessere Noten in den drei Fächern
2.)bessere motor. Leistungen bedeuten bessere kognitive Testergebnisse(2.1 Mathe-, 2.2 Lese- und 2.3 Schreibtest)
3.) höhere Sportaktivität bedeutet bessere kognitive Testergebnisse(3.1 Mathe-, 3.2 Lese- und 3.3 Schreibtest)
4.) Sportaktivität und motor. Leistung korrelieren positiv miteinander
5.) Mathe- und Deutschtests(kogn. Testergebnisse) korrelieren mit Schulnoten in Mathe und Deutsch

Soweit so gut. Jetzt zu meinen Problemen:

Kann ich überhaupt Hypothesen aufstellen mit abhängiger und unabhängiger Variable??? Woher weiß ich, dass motor. Leistung positiv auf die kogn. Leistungen einwirkt und nicht umgekehrt (also gute kogn. Leistungen zu guten motor. Leistungen führen)???
Ich bin mir bereits ohne Test ziemlich sicher, dass die Stichprobe nirgendwo Normalverteilt ist. Die Leistungen der Klasse sind in allen Bereichen überdurchschnittlich gut. Welche Testverfahren kann ich da überhaupt anwenden bei der kleinen Stichproben und keiner Normalverteilung?

Ich arbeite mit SPSS 22.0 und würde so vorgehen:

1.) Test auf Normalverteilung mit Shapiro wilk Test.
Problem: Welche Daten muss ich auf Normalverteilung überprüfen? Nur die motorischen oder alle Variablen die ich habe? Rohwerte oder auch T-Werte?

2.) Jetzt würde ich jeweils für alle Hypothesen mit Spearman testen.
Problem: muss ich nicht eher eine lineare Regressionsanalyse durchfühhren, da meine Hypothesen gerichtet sind? Kann ich das überhaupt mit einer nichtnormalverteilten Stichprobe?

3.) Ich würde eine multiple Regression durchführen in der ich die motorischen Leistungen und Sportaktivität sowie die kognitiven Daten gemeinsam teste.

Generell bin ich mir unsicher, welche Variablen ich verwenden soll? (Rohwerte oder T-Werte?)

Meine Dozentin sagt, ich soll Unterschiede in der Varianzaufklärung aufzeigen!? (lineare und multiple Regression). Was heißt das genau?

Dann soll ich mit einem Median-Split für jede Testaufgabe in die Gruppen Unfit und Fit aufteilen und hinsichtlich des Odds Ratios analysieren. Median kriege ich noch hin. Aber wie mache ich den Odds Ratio Test?

Für die 3 kognitiven Testverfahren habe ich Normwerte (Prozentränge, T-Werte und Rohwerte). Hier soll ich einen Grenzwert setzen!?

Ich weiß, ist ziemlich viel Text... Aber wäre schon super hilfreich, wenn vielleicht ein paar der vielen Fragen klarer für mich würden. :)
srek
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mi 22. Apr 2015, 13:01
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Welche stat. Verfahren bei n=22 nicht normalverteilt?

Beitragvon PonderStibbons » Mi 22. Apr 2015, 20:34

Kann ich überhaupt Hypothesen aufstellen mit abhängiger und unabhängiger Variable???

Klar.
Woher weiß ich, dass motor. Leistung positiv auf die kogn. Leistungen einwirkt und nicht umgekehrt (also gute kogn. Leistungen zu guten motor. Leistungen führen)???

Kausalitäten kannst Du ohne experimentelle Untersuchung mit Experimental und Kontrollgruppe
nicht nachweisen. Das ist den statistischen Verfahren allerdings wurscht.

Da Du, wie es aussieht, Deine Hypothesen mit Korrelationsrechnungen prüfen
kannst/wirst (Spearman-Rangkorrelationen, da die meisten Deiner Messwungen
ordinal/rangskaliert sind und Deine Stichprobe ziemlich klein ist), gibt es
nichtmal abhängige und unabhängige Variablen dabei.

Ich bin mir bereits ohne Test ziemlich sicher, dass die Stichprobe nirgendwo Normalverteilt ist. Die Leistungen der Klasse sind in allen Bereichen überdurchschnittlich gut.

Das letztere hat mit dem ersteren eigentlich nichts zu tun.
Wenn Du Rangkorrelationen rechnest, sind Normalverteilungsüberlegungen
aber sowieso egal. Normalverteilungsüberlegungen betreffen, wenn überhaupt,
nur intervallskalierte Variablen.

3.) Ich würde eine multiple Regression durchführen in der ich die motorischen Leistungen und Sportaktivität sowie die kognitiven Daten gemeinsam teste.

Kannst Du bei n=22 eigentlich vergessen. Bzw. mit maximal
2 Prädiktoren durchführbar, aber das ist auch schon mehr als knapp.
Bei n=22 müssten dann aber auch die Verteilungsvoraussetzungen
erfüllt sein. Das heißt, die Vorhersagefehler des Regressionsmodells,
die Residuen [NICHTdie abhängige und schon gar nicht die
unabhängigen Variablen!] sollten aus einer normalverteilten
Grundgesamtheit stammen, damit der Signifikanztest zuverlässige
Ergebnisse liefert.

Generell bin ich mir unsicher, welche Variablen ich verwenden soll? (Rohwerte oder T-Werte?)

Wenn alle Schüler aus derselben Normgruppe sind, ist es doch egal.
Andernfalls beides.

Meine Dozentin sagt, ich soll Unterschiede in der Varianzaufklärung aufzeigen!? (lineare und multiple Regression). Was heißt das genau?

Dass sie von Fallzahlplanung, erforderlichen Stichprobengrößen,
Skalenniveaus und präziser Formulierung von Fragestellungen womöglich
keine Ahnung hat? Bei n=22 von multipler Regression zu reden (s.o.)
und "Unterschiede in der Varianzaufklärung" nachweisen zu wollen, ist
abwegig. Aber vielleicht geht es gar nicht um Inhaltliches oder Ergebnisse,
sondern nur darum, Statistik einmal anhand einer echten Studie zu üben?

Übrigens ist es nicht lineare und multiple Regression,
sondern einfache lineare Regression und multiple lineare Regression
(es gibt auch einfache nicht-lineare und multiple nicht-lineare Regressionverfahren)

Dann soll ich mit einem Median-Split für jede Testaufgabe in die Gruppen Unfit und Fit aufteilen und hinsichtlich des Odds Ratios analysieren. Median kriege ich noch hin. Aber wie mache ich den Odds Ratio Test?

Hm, also vielleicht doch eine Fingerübung? Median splits sind ja normalerweise
das schlimmste, was man machen kann, aber wenn man Auswertung binärer
Variablen üben will, kann vielleicht mal. Zu analysieren heißt nicht
automatisch dasselbe wie zu testen, Du kannst die odds ratios berechnen ohne
Signifikanztest. Der Test über den Zusammenhang wurde ja bereits bei der
Spearman-Korrelation durchgeführt. Ansonsten reicht aber doch der übliche
Chi² Test.

Für die 3 kognitiven Testverfahren habe ich Normwerte (Prozentränge, T-Werte und Rohwerte). Hier soll ich einen Grenzwert setzen!?

Und was meinst Du damit?
Ich weiß, ist ziemlich viel Text... Aber wäre schon super hilfreich, wenn vielleicht ein paar der vielen Fragen klarer für mich würden.

Der eigentliche Ansprechpartner wäre Deine Dozentin bzw. Eure
Statistikberatung. Von hier aus liest sich das alles recht eigenartig.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11276
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts

folgende User möchten sich bei PonderStibbons bedanken:
srek

Re: Welche stat. Verfahren bei n=22 nicht normalverteilt?

Beitragvon srek » Do 23. Apr 2015, 13:06

Danke für die ausführlichen Antworten!!!

Eine Sache ist mir noch nicht so ganz klar:

Ist eine gerichtete Hypothese das gleiche wie eine Hypothese mit einer abhängigen und einer unabhängigen Variable? Oder kann man auch eine gerichtete Hypothese stellen mit zwei unabhängigen Variablen? Also z.B.: A nimmt zu wenn B zunimmt. Und umgekehrt. Richtung der Kausalität ist aber unbekannt.

Möglich wäre ja auch, dass man nicht einmal die Richtung des Zusammenhanges weiß bzw. in der Hypothese aufstellt/angibt.

Ich frage, da meine Dozentin ja eine gerichtete Hypothese verlangt. Mir ist allerdings vollkommen schleierhaft, wie ich die Richtung der Kausalität bestimmen soll bei meiner Stichprobe und Versuchsanordnung mit nur einer Klasse!?!?!?
srek
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mi 22. Apr 2015, 13:01
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Welche stat. Verfahren bei n=22 nicht normalverteilt?

Beitragvon srek » Do 23. Apr 2015, 13:16

Nachtrag:
Ich hatte das eigentlich so aufgefasst, dass die Vermutung über einen positiven Zusammenhang z.B. ausreicht, damit eine Hypothese gerichtet ist. Bei meiner Hypothese "Es besteht ein positiver Zusammenhang zwischen motorischen und schulischen Leistungen bei Kindern" wurde jedoch angemerkt, dass meine Hypothesen doch bitte gerichtet sein sollen.

Daher meine Irritation....
srek
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mi 22. Apr 2015, 13:01
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Welche stat. Verfahren bei n=22 nicht normalverteilt?

Beitragvon PonderStibbons » Do 23. Apr 2015, 14:02

Ist eine gerichtete Hypothese das gleiche wie eine Hypothese mit einer abhängigen und einer unabhängigen Variable?

Es gibt ungerichtete Arbeitshypothesen wie "die Mittelwerte der Gruppen A und B unterscheiden sich"
oder "es besteht ein Zusammenhang zwischen X und Y", und es gibt gerichtete Arbeitshypothesen wie
"A hat einen höheren Mittelwert als B", "es besteht ein negativer Zusammenhang zwischen X und Y".

Gerichtetheit hat also nichts mit WIRK-Richtungen (Kausalität) zu tun, sondern mit der Richtung von
Unterschieden (z.B. A > B) bzw. Effekten (z.B. Korrelation < 0).

Ich hatte das eigentlich so aufgefasst, dass die Vermutung über einen positiven Zusammenhang z.B. ausreicht, damit eine Hypothese gerichtet ist. Bei meiner Hypothese "Es besteht ein positiver Zusammenhang zwischen motorischen und schulischen Leistungen bei Kindern" wurde jedoch angemerkt, dass meine Hypothesen doch bitte gerichtet sein sollen.

Das ist mir nun rätselhaft, da Du doch in der Tat eine gerichtete (Arbeits-)Hypothese
formuliert hast. Vielleicht meint sie, Du sollst eine einseitige Nullhypothese aufstellen.
Das wäre zwar in aller Regel schlechte Praxis (siehe http://www.uni-graz.at/ilona.papousek/t ... s/faq.html FAQ 3),
würde aber ins Bild passen. Dass mit "gerichtet" eine Wirkrichtung gemeint sein könnte,
will ich mir nicht so recht vorstellen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11276
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts

Re: Welche stat. Verfahren bei n=22 nicht normalverteilt?

Beitragvon srek » Do 23. Apr 2015, 20:25

Danke für die Antwort und den Link!!!
Auf Basis aller Informationen habe ich jetzt folgende Hypothesen und statistische Vorgehensweise gewählt (siehe folgenden Text).

Kann man das so machen??? Ist ja fast überall Spearman. Gibts da noch mehr was man an Testverfahren in SPSS hinzuziehen kann?
Was genau kann ich mit der Gruppenaufteilung in "Fit" und "Unfit" anfangen? Und wofür brauche ich bzw. verwende ich die Odds Ratios?

Danke schonmal im Voraus!!!


Alle Hypothesen sind gerichtet(Je besser…., desto besser….), geben aber keine Richtung der Kausalität vor.

1.) Übergeordnete Hypothese zum Zusammenhang zwischen motorischen und kogn. Leistungen: Es besteht ein positiver Zusammenhang zwischen motorischen Leistungen und kognitiven Leistungen bei Kindern. D.h.: Je besser die motorischen Leistungen, desto besser die kognitiven Leistungen (oder auch umgekehrt!). -> Ebenso bei allen anderen Hypothesen!

Grundlegende Teile der deskriptiven Statistik werden in den folgenden Beschreibungen außen vor gelassen! (Mittelwerte, Häufigkeiten, Standardabweichungen usw.)


Vorbereitende Verfahren zu den motor. Daten:
- Test auf Normalverteilung der Rohwerte der 5 Testverfahren mit dem Shapiro-Wilk-Test
- Median-Split für jede der 5 Testaufgaben und Gruppenaufteilung in “Fit” und “Unfit”
- Analyse der beiden Gruppen hinsichtlich des Odds Ratios

Vorbereitende Verfahren zu den kogn. Daten (Deutschtest1, Deutschtest2, Mathetest):
- Test auf Normalverteilung der Rohwerte der 3 Testverfahren mit dem Shapiro-Wilk-Test
- Einteilung der Schüler in Leistungsgruppen anhand der Grenzwerte der Normentabellen

1.1.) Es besteht ein positiver Zusammenhang zwischen motorischen Leistungen und grundlegenden mathematischen Fähigkeiten bei Kindern.

- da Daten nicht normalverteilt -> bivariate Korrelation nach Spearman für die Gesamtstichprobe: Rohwerte der 5 Motriktests und Rohwerte des DEMAT3+
- gleicher Test getrennt nach Geschlecht, sofern sich im Vorfeld geschlechtsspezifische Unterschiede gezeigt haben

-> gleiches Vorgehen für 1.2) und 1.3)

1.2) Es besteht ein positiver Zusammenhang zwischen motorischen Leistungen und der Rechtschreibfähigkeit bei Kindern.

1.3) Es besteht ein positiver Zusammenhang zwischen motorischen Leistungen und dem Leseverständnis bei Kindern.

2.) Übergeordnete Hypothese zum Zusammenhang zwischen Sportaktivität und kognitiven Leistungen: Es besteht ein positiver Zusammenhang zwischen der Sportaktivität und kognitiven Leistungen bei Kindern.

Vorbereitende Verfahren zu den Daten zur Sportaktivität:
- Test auf Normalverteilung der Rohwerte mit dem Shapiro-Wilk-Test

2.1) Es besteht ein positiver Zusammenhang zwischen der Sportaktivität und grundlegenden mathematischen Fähigkeiten bei Kindern.

- spearman

2.2) Es besteht ein positiver Zusammenhang zwischen der Sportaktivität und der Rechtschreibfähigkeit bei Kindern.

- spearman

2.3) Es besteht ein positiver Zusammenhang zwischen der Sportaktivität und dem Leseverständnis bei Kindern.

- spearman

3.) Es besteht ein positiver Zusammenhang zwischen der Sportaktivität und den motorischen Leistungen bei Kindern.

- spearman

4.) Übergeordnete Hypothese zum Zusammenhang zwischen Schulnoten und den kognitiven Testverfahren: Es besteht ein positiver Zusammenhang zwischen fachlichen Einschätzungen von Lehrern (Schulnoten) und wissenschaftlichen, kognitiven Testverfahren.

-> Noten sind ja ordinalskaliert, die Testverfahren intervallskaliert. Kann ich hier mischen oder muss ich die Testergebnis zuvor auch in ordinale Daten umwandeln (Ränge nach Grenzwerten)?

4.1) Es besteht ein positiver Zusammenhang zwischen den Mathenoten und dem Testverfahren Mathe.

- spearman

4.2) Es besteht ein positiver Zusammenhang zwischen den Deutschnoten und den Testverfahren Deutsch.

- spearman
srek
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mi 22. Apr 2015, 13:01
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Welche stat. Verfahren bei n=22 nicht normalverteilt?

Beitragvon PonderStibbons » Do 23. Apr 2015, 23:14

Mediansplit und Einteilung in Leistungsgruppen vernichtet statistische Informationen,
man kann es für deskriptive Zwecke (nicht für Signifikanztests) aber in Betracht ziehen.
Normalverteilungstests sind hier nur begrenzt nütze, da bei nur n=22 auch markante
Abweichungen vom Test nicht erkannt werden und Du ohnehin keine Verfahren rechnest,
für die Normalverteilung der Variablen erforderlich wäre. Leg's halt Deiner Betreuerin vor.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11276
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts

Re: Welche stat. Verfahren bei n=22 nicht normalverteilt?

Beitragvon srek » Fr 24. Apr 2015, 16:40

Ok, das hilft schonmal ungemein weiter - danke!

Und für die Korrelation kann ich jedesmal Spearman nehmen? Oder gibt es da noch ergänzende/bessere Verfahren wie ich auf positive Zusammenhänge testen kann?
srek
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mi 22. Apr 2015, 13:01
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Welche stat. Verfahren bei n=22 nicht normalverteilt?

Beitragvon srek » So 26. Apr 2015, 10:39

Würde eine multivariate lineare Regression Sinn machen zwischen Sportaktivität + Motorik -> kognitive Leistungen?
srek
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mi 22. Apr 2015, 13:01
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste