Seite 1 von 1

Geclusterte Daten, zu kleine Stichprobe f. Mehrebenenanalyse

BeitragVerfasst: Fr 11. Okt 2019, 12:30
von Schaumgummiball
Hallo zusammen,

ich habe folgendes Problem: Ich möchte den Zusammenhang zwischen den Überzeugungen von Lehrkräften und verschiedenen intervallskalierten Merkmalen der Schule berechnen. Da davon auszugehen ist, dass die Clusterung der Lehrkräfte in den Schulen zu verzerrten Standardfehlern führt, müsste ich eigentlich Mehrebenenanalysen rechnen oder zumindest die Standardfehler anpassen. Ich habe aber auf Level 2 (Schule) leider nur 8 Fälle; bei MPlus beispielsweise wird für beide Prozeduren von mindestens 20 Fällen auf Level 2 ausgegangen, um eine verlässliche Schätzung zu erhalten.
Deshalb würde ich gerne fragen, ob es noch andere Optionen gibt, die Clusterung der Lehrkräfte in den Schulen zu berücksichtigen? Würde es zum Beispiel Sinn machen, die Variablen am (schulbezogenen) Gruppenmittelwert zu zentrieren?

Ich freue mich über jede Anregung! :)
Vielen Dank im Voraus
Schaumgummiball

Re: Geclusterte Daten, zu kleine Stichprobe f. Mehrebenenana

BeitragVerfasst: Fr 11. Okt 2019, 18:15
von strukturmarionette
Hi,

Da davon auszugehen ist, dass die Clusterung der Lehrkräfte in den Schulen

- was clusterst Du wie?
- N?

Gruß
S.

Re: Geclusterte Daten, zu kleine Stichprobe f. Mehrebenenana

BeitragVerfasst: Mo 14. Okt 2019, 07:19
von Schaumgummiball
Vielen Dank für Deine Antwort!

Ich habe das vermutlich etwas missverständlich ausgedrückt: Ich habe nichts geclustert, sondern die Lehrkräfte sind "auf natürliche Weise" in den Schulen geclustert bzw. genestet. Ich habe acht Schulen und insofern acht Cluster und es ist stark davon auszugehen, dass die Einschätzung organisationaler Merkmale der Schule durch die Zugehörigkeit zu einer bestimmten Schule beeinflusst wird, ich muss also Gruppierungseffekte berücksichtigen.
Insgesamt habe ich ein N von knapp 500 Lehrkräften, die sich auf die acht Schulen verteilen.

Danke und viele Grüße
Schaumgummiball

Re: Geclusterte Daten, zu kleine Stichprobe f. Mehrebenenana

BeitragVerfasst: Mo 14. Okt 2019, 12:50
von bele
Hallo Schaumgummiball,

das Problem ist immer noch nicht klar und scheint mir u. a. ein Nomenklaturproblem zu sein.

Ich habe aber auf Level 2 (Schule) leider nur 8 Fälle


Meinst Du Fälle oder Ausprägungen?

Anders gesagt: Du untersuchst also 500 Lehrkräfte und die Unterteilen sich auf 8 Schulen. Beklagst Du Dich jetzt, dass es leichter zu schätzen wäre, wenn die 500 Lehrer sich auf 20 Schulen verteilen würden oder ist das Problem dass es eine Schule gibt, die nur 8 Lehrer stellt?

LG,
Bernhard

Re: Geclusterte Daten, zu kleine Stichprobe f. Mehrebenenana

BeitragVerfasst: Mo 14. Okt 2019, 14:13
von Schaumgummiball
Ich "beklage" mich darüber (bzw. suche ich eigentlich eher nach Lösungen dafür), dass sich die 500 Lehrkräfte auf nur 8 Schulen verteilen und ich deshalb keine Mehrebenenanalyse rechnen kann, und suche andere Lösungen, über die ich die hierarchische Struktur meiner Daten berücksichtigen kann.

Re: Geclusterte Daten, zu kleine Stichprobe f. Mehrebenenana

BeitragVerfasst: Mo 14. Okt 2019, 15:41
von bele
Ich denke, dass Du kein Problem hast: Auf je weniger Schulen sich die Lehrkräfte verteilen, umso mehr Information ist pro Schule da. 500 Schulen wären ein großes Problem, eine Schule wäre das Ende des Problems. Wähle ein fixed effects modell, dann kannst Du über jede der 8 Schulen präzise mit durchschnittlich 62 Datensätzen gute Aussagen machen.

LG,
Bernhard

Re: Geclusterte Daten, zu kleine Stichprobe f. Mehrebenenana

BeitragVerfasst: Sa 19. Okt 2019, 14:38
von Holgonaut
Hi Schaumgummiball,

die paper hier beschreiben Deine Situation ganz gut

McNeish, D., Stapleton, L. M., & Silverman, R. D. (2017). On the unnecessary ubiquity of hierarchical linear modeling. Psychological Methods, 22(1), 114-140. doi:10.1037/met0000078

McNeish, D., & Stapleton, L. M. (2016). Modeling clustered data with very few clusters. Multivariate Behavioral Research, 51(4), 495-518.

Tenor ist, dass ein fixed effects model (wie Bele sagt) mit geclusterten SEs ok sein sollte. Die sollten auch bei geringem N auf level 2 kein Problem sein. Es gibt aber auch andere Ansichten, die sagen, dass man auch dann multilevel rechnen sollte. Dummerwiese find ich die Artikel nicht....

Grüße
Holger