Gruppenunterschiede - nicht normalverteilt/ Gruppengröße

Alles zu (M)ANOVA, ALM...

Gruppenunterschiede - nicht normalverteilt/ Gruppengröße

Beitragvon ArDsk » Di 9. Mär 2021, 19:01

Hallo Zusammen,

ich versuche gerade eine nicht normalverteilte Variable auf Gruppenunterschiede zu testen.
Dazu habe ich einen Kruskal-Wallis Test gewählt. Klappt auch alles super.

Ich teste auf Gruppenunterschiede anhand des Herkunftslandes der Probanden. Leider habe ich teilweise Gruppen (Herkunftsländer) mit einem N von 1 bis 6. Meine Gesamtstichprobe beträgt 720.
Ergibt es Sinn die Varianzanalyse trotzdem für Gruppen mit einem N größer 10 durchzuführen und die anderen kleinen Gruppen zu ignorieren? Oder doch lieber zu größeren Gruppen zusammenfassen?

https://ibb.co/C9hwQ6p

Die Gruppen, die ich auf Unterschiede testen würde, wären Polen, Russland, Türkei, Syrien und Deutschland.

Wäre super, wenn mir jemand nochmal bestätigen würde, das die Variable nicht normalverteilt ist: https://ibb.co/t3ZgNz4 KS-Test ist signifikant, mit.00

Vielen Dank vorab für eure Hilfe.
ArDsk
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 9. Mär 2021, 18:46
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Gruppenunterschiede - nicht normalverteilt/ Gruppengröße

Beitragvon PonderStibbons » Di 9. Mär 2021, 19:22

ich versuche gerade eine nicht normalverteilte Variable auf Gruppenunterschiede zu testen.

Nicht abhängige Variablen sollen normalverteilt sein, sondern die Variable in den einzelnen
Gruppen bzw. einfach die Vorhersagefehler (Residuen) des Modells. Und auch das nur dann,
wnen die Stichprobe klein ist (unter 30), bei größeren Stichproben sind die Verfahren robust.
Wer hat Dir denn weisgemacht, dass Normalverteilung hier von Belang sein soll?
Ergibt es Sinn die Varianzanalyse trotzdem für Gruppen mit einem N größer 10 durchzuführen und die anderen kleinen Gruppen zu ignorieren? Oder doch lieber zu größeren Gruppen zusammenfassen?

Wie lautet denn die Forschungsfrage hinter dieser Analyse? Zig Kategorien in eine
Varianzanalyse zu packen, wirkt erstmal nicht besonderns sinnvoll. Eine Gruppe
mit n=1 geht sowieso nicht.
Die Gruppen, die ich auf Unterschiede testen würde, wären Polen, Russland, Türkei, Syrien und Deutschland.

Wenn das Dein Erkenntnisinteresse trifft, kannst Du das ja machen. Es scheinen aber
gerade die Länder zu sein, bei denen n > 10 ist. War das so von vornherein geplant?
Wäre super, wenn mir jemand nochmal bestätigen würde, das die Variable nicht normalverteilt ist: https://ibb.co/t3ZgNz4 KS-Test ist signifikant, mit.00

Juckt doch keinen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

Re: Gruppenunterschiede - nicht normalverteilt/ Gruppengröße

Beitragvon ArDsk » Di 9. Mär 2021, 20:08

Nicht abhängige Variablen sollen normalverteilt sein, sondern die Variable in den einzelnen
Gruppen bzw. einfach die Vorhersagefehler (Residuen) des Modells. Und auch das nur dann,
wnen die Stichprobe klein ist (unter 30), bei größeren Stichproben sind die Verfahren robust.
Wer hat Dir denn weisgemacht, dass Normalverteilung hier von Belang sein soll?


Klar Sry, es geht um die Verteilung der AV innerhalb der Gruppen, diese sind nicht normalverteilt. Arbeite da nach einem Uni-Skript -> deshalb MWU-Test.

Wie lautet denn die Forschungsfrage hinter dieser Analyse? Zig Kategorien in eine
Varianzanalyse zu packen, wirkt erstmal nicht besonderns sinnvoll. Eine Gruppe
mit n=1 geht sowieso nicht.


Die Hypothese lautet bislang nur, dass meine AV sich innerhalb der Gruppe X unterscheidet. -> klar wäre es interessant, wenn ich mit einem Post Hoc herausfinden würde, welche Gruppen sich denn sig. unterscheiden.

Wenn das Dein Erkenntnisinteresse trifft, kannst Du das ja machen. Es scheinen aber
gerade die Länder zu sein, bei denen n > 10 ist. War das so von vornherein geplant?


Es ist eher eine Lösung. Vielleicht gibt es eine statistische "Formel" wie stark die Gruppen sich in Ihrer Größe unterschieden dürfen, um sinnvolle Aussagen zu treffen. Also eine Gruppe mit N = 400 mit einer Gruppe N= 10 zu vergleichen ist logisch gesehen schon vage, besonders wenn es sich um Mittelwertindizes handelt. Sonst würde ich natürlich einfach alle größer n> 1 nehmen, und nur sig. Unterschied Reporten.

Juckt doch keinen.

Letzteres diente eher der Bestätigung für spätere Berechnungen, da gehen die Meinungen auseinander, ob der KS-Test zu konservativ ist.

Danke für die schnelle und hilfreiche Antwort.
ArDsk
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 9. Mär 2021, 18:46
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Gruppenunterschiede - nicht normalverteilt/ Gruppengröße

Beitragvon PonderStibbons » Di 9. Mär 2021, 22:50

Es ist eher eine Lösung. Vielleicht gibt es eine statistische "Formel" wie stark die Gruppen sich in Ihrer Größe unterschieden dürfen, um sinnvolle Aussagen zu treffen.

Das ist keine Statistikfrage. Bei ungleichen Gruppengrößen ist lediglich zu gewährleisten, dass die Varianzen
ähnlich sind. Bzw. beim H-Test selbst darauf nicht. Ich kann nur die Forschungsfrage noch nicht verstehen.
"Unterscheiden sich bis zu 40 Gruppen hinsichtlich Y, und gegebenenfalls würde ich 780 paarweise Vergleiche
durchführen" entspräche zwar Deinem Vorgehen, ist aber vermutlich nicht die tatsächliche Frage.

Also eine Gruppe mit N = 400 mit einer Gruppe N= 10 zu vergleichen ist logisch gesehen schon vage, besonders wenn es sich um Mittelwertindizes handelt.

Logisch schon sehr vage verstehe ich als Aussage leider nicht. Durchführbar ist das allemal,
allerdings vergleicht der H-Test keine Mittelwerte, er ist ein Verfahren für Rangdaten.

Juckt doch keinen.

Letzteres diente eher der Bestätigung für spätere Berechnungen, da gehen die Meinungen auseinander, ob der KS-Test zu konservativ ist.


Die gestellte Frage (Verteilung der AV) war irrelevant. Und bei einer solchen Stichprobengröße wird jeder
Normalverteilungstest sowieso statistisch signifikant, ungeachtet dessen, ob die Abweichung groß oder
klein ist. Die eigentliche Frage, ob die Residuen aus einer normalverteilten Grundgesamtheit stammen,
wurde damit nicht bearbeitet. Aber wie gesagt ist auch diese Annahme ab n > 30 für eine Varianzanalyse
nicht mehr von Belang (zentraler Grenzwertsatz). Ich bin ernsthaft irritiert, was sie Dir da als Uni-Skript
verpasst haben. Wir haben 2021, nicht mehr 1991.

Mit freundlichen Grüßen

PonderStibbons


Danke für die schnelle und hilfreiche Antwort.[/quote]
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts


Zurück zu Varianzanalysen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste