unbalanciertes Design

Alles zu (M)ANOVA, ALM...

unbalanciertes Design

Beitragvon asil1 » Mo 15. Feb 2021, 09:54

Ich habe innerhalb meines experimentellen Desings zwei uvs manipuliert. Eine dritte uv habe ich lediglich abgefragt und nicht manipuliert. Im Anschluss habe ich, da es viele Arbeiten in diesem Feld so machen, die manipulierten uvs (uv 1 und uv 2) mittels Median Split geteilt. Da der Median-Split häufig kritisiert wird habe ich diskutiert und ist mir bekannt. Dementsprechend habe ich die nun dichotomisierten Variable (uv 1 und uv 2) als feste Faktoren in die Varianzanalyse aufgenommen. Die dritte Variable (uv 3), welche nicht manipuliert wurde, habe ich als Kovariate mit in das Modell aufgenommen.

Nun zeigt sich, dass das Modell unbalanciert ist:

Uv 1: niedrig: 100
Hoch: 101

Uv 2: niedrig: 91
Hoch: 110

Uv 3 (metrische Kovariate): 201

Meine Fragen:
Wie hoch darf die Differenz zwischen den Gruppen sein, damit eine Anova auch bei unbalancierten Design richtige Ergebnisse bringt?
Sollte ich die Ergebnisse der ANOVA verwerfen und mit den drei metrischen Variablen lieber eine Regressionsanalyse rechnen, da die unbalanciertheit ja nur aus dem Median-Split resultiert?
asil1
Mitglied
Mitglied
 
Beiträge: 28
Registriert: So 1. Nov 2020, 15:13
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: unbalanciertes Design

Beitragvon bele » Mo 15. Feb 2021, 10:42

Eine gute Antwort habe ich nicht, aber die 90 zu 110 erscheint mir vom Bauchgefühl nicht viel. Wieso es aber bei einem Mediansplit zu so einer Ungleichverteilung kommt, das ist schon eine Frage wert. Hatten 5% der Stichprobe genau den UV2-Wert, der dem Median von UV2 entspricht?

Sollte ich die Ergebnisse der ANOVA verwerfen und mit den drei metrischen Variablen lieber eine Regressionsanalyse rechnen


Schwierige Frage. Du eröffnest damit, dass Dir die Nachteile des Mediansplits bekannt sind. Im Subtext lese ich, dass der Mediansplit hier nicht Diskussionsgegenstand sein soll. Und nun diese Frage, die zu einer Diskussion des Mediansplits einlädt. Die Wortführer hier im Forum halten nichts von Mediansplits und würden daher ohnehin zur ANCoVA (oder eben einer Regression) raten.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5774
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1356 mal in 1343 Posts

folgende User möchten sich bei bele bedanken:
asil1

Re: unbalanciertes Design

Beitragvon asil1 » Mo 15. Feb 2021, 12:48

Erstmal danke für die wie immer sehr hilfreiche Antwort!

Tatsächlich haben genau 22 Probanden Wert 4, das entspricht dem Median.

Schwierige Frage. Du eröffnest damit, dass Dir die Nachteile des Mediansplits bekannt sind. Im Subtext lese ich, dass der Mediansplit hier nicht Diskussionsgegenstand sein soll. Und nun diese Frage, die zu einer Diskussion des Mediansplits einlädt. Die Wortführer hier im Forum halten nichts von Mediansplits und würden daher ohnehin zur ANCoVA (oder eben einer Regression) raten.


Ich meinte eher, ob die Regression besser wäre, wegen der Ungleichverteilung der Daten. Ich habe in meiner Arbeit aber eh beide Varianten gerechnet mit Median-Split (ANOVA) und ohne (Regression), um wirklich alles abzudecken.
asil1
Mitglied
Mitglied
 
Beiträge: 28
Registriert: So 1. Nov 2020, 15:13
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: unbalanciertes Design

Beitragvon bele » Mo 15. Feb 2021, 14:02

Hallo asil,

asil1 hat geschrieben:Tatsächlich haben genau 22 Probanden Wert 4, das entspricht dem Median.


Dann stellt sich die Frage, warum Du die alle der Gruppe "hoch" zugeordnet hast und nicht zur Hälfte der Gruppe hoch und zur Hälfte der Gruppe niedrig oder alle 22 der Gruppe niedrig zugeordnet hast. Letztlich gibt es für keine dieser Vorgehensweisen einen vernünftigen Grund aber das 50:50-Aufteilen würde das Problem beheben (von dem ich eher nicht glaube, dass es ein Problem ist).
Im Übrigen ist mir rechnerisch unklar, wie Du mit 22 Probanden auf einen Gruppenunterschied von 19 kommst. Da solltest Du nochmal nachschauen.

Ich meinte eher, ob die Regression besser wäre, wegen der Ungleichverteilung der Daten. Ich habe in meiner Arbeit aber eh beide Varianten gerechnet mit Median-Split (ANOVA) und ohne (Regression), um wirklich alles abzudecken.


Kommst Du zum gleichen Ergebnis? Damit meine ich nicht den gleichen p-Wert sondern die gleiche Antwort auf Deine Forschungsfragestellung.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5774
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1356 mal in 1343 Posts

Re: unbalanciertes Design

Beitragvon asil1 » Mo 15. Feb 2021, 15:24

Dann stellt sich die Frage, warum Du die alle der Gruppe "hoch" zugeordnet hast und nicht zur Hälfte der Gruppe hoch und zur Hälfte der Gruppe niedrig oder alle 22 der Gruppe niedrig zugeordnet hast. Letztlich gibt es für keine dieser Vorgehensweisen einen vernünftigen Grund aber das 50:50-Aufteilen würde das Problem beheben (von dem ich eher nicht glaube, dass es ein Problem ist).


Ja das ist richtig. Die Frage habe ich mir auch gestellt. Ich habe mich an einem Vorgehen eines Statistikers namens Florack orientiert. Dort wurde bei Spss eine neue Variable berechnet und dabei zuerst alles größer des Medians als hoch codiert und alles kleiner als niedrig. Wenn ich die Probanden am Median aufteilen würde, müsste ich das auch für die uv1 machen, damit ich konsistent bleibe. Dann hätte ich dort in einer Gruppe drei weniger und in einer drei mehr. Das könnte ich überlegen.

Im Übrigen ist mir rechnerisch unklar, wie Du mit 22 Probanden auf einen Gruppenunterschied von 19 kommst. Da solltest Du nochmal nachschauen.


Vermutlich liegt die Ungleichheit nicht nur am Median-Split oder?

Code: Alles auswählen
Kommst Du zum gleichen Ergebnis? Damit meine ich nicht den gleichen p-Wert sondern die gleiche Antwort auf Deine Forschungsfragestellung.


Genau dort konnte ich die gleichen Hypothesen verwerfen bzw, annehmen wie beim Median-Split
asil1
Mitglied
Mitglied
 
Beiträge: 28
Registriert: So 1. Nov 2020, 15:13
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: unbalanciertes Design

Beitragvon bele » Mo 15. Feb 2021, 16:12

asil1 hat geschrieben:Die Frage habe ich mir auch gestellt. Ich habe mich an einem Vorgehen eines Statistikers namens Florack orientiert. Dort wurde bei Spss eine neue Variable berechnet und dabei zuerst alles größer des Medians als hoch codiert und alles kleiner als niedrig.


Da es keine allgemeingültige Definition für den Median gibt halte ich es erstmal für unwahrscheinlich, dass es eine allgemeingültige Definition für den Mediansplit gibt. Ich glaube nicht, dass Du an dieses Beispiel gebunden bist.

Wenn ich die Probanden am Median aufteilen würde, müsste ich das auch für die uv1 machen, damit ich konsistent bleibe. Dann hätte ich dort in einer Gruppe drei weniger und in einer drei mehr. Das könnte ich überlegen.


Wenn es keine allgemeinverbindliche Definition von Mediansplit gibt, dann machst Du die Regeln. Definier doch: Probanden die genau den Median als Beobachtungswert haben werden so auf die Gruppen aufgeteilt, dass die Gruppen gleichgroß werden oder höchstens um 1 abweichen.

]Kommst Du zum gleichen Ergebnis? Damit meine ich nicht den gleichen p-Wert sondern die gleiche Antwort auf Deine Forschungsfragestellung.


Genau dort konnte ich die gleichen Hypothesen verwerfen bzw, annehmen wie beim Median-Split


Das ist doch das beste. Dann finden sich bestimmt andere Aspekte der Arbeit, für die sich Dein Grübelaufwand lohnender investieren ließe.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5774
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1356 mal in 1343 Posts

folgende User möchten sich bei bele bedanken:
asil1


Zurück zu Varianzanalysen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste