Einfaktorielle Varianzanalyse an einer Stichprobe

Alles zu (M)ANOVA, ALM...

Einfaktorielle Varianzanalyse an einer Stichprobe

Beitragvon BAMJAN » Mi 12. Okt 2022, 15:21

Hey Leute,

da ich in Bezug auf Statistik sehr unsicher bin, hoffe das Ihr mir in diesem Forum bei meinem Anliegen weiter helfen könnt.


Ich habe die Daten einer Stichprobe in einer größeren Altersrange von 18 bis +70, welche in einer Onlineumfrage die Rosenberg Self-Esteem-Scale ausgefüllt haben. Aus vorherigen Studien und theoretischen Überlegungen ergibt sich die Annahme, dass sich das Selbstwertgefühl vom Alter von 18 bis zum mittleren Erwachsenenalter stetig steigern sollte (und nach dem Höhepunkt um ca. 65 Jahren wieder abnimmt, was für meine Hypothese aber unerheblich ist).

Meine Hypothese ist also demnach, dass das durchschnittliche Selbstwertgefühl im mittleren Erwachsenenalter höher sein wird als im jungen erwachsenen Alter.

Ist es dann ein zulässiges Verfahren, wenn ich eine einfaktorielle Varianzanalyse errechne, in dem ich meine Stichprobe dem Alter entsprechend in mehrere Gruppen einteile und dann auf die unabhängige Variable "Alter" und die abhängige Variable "Wert Selbstwertgefühl" teste oder ist ein anderes statistisches Verfahren angezeigt?

Vielen Dank im voraus!
BAMJAN
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Mi 12. Okt 2022, 14:56
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Einfaktorielle Varianzanalyse an einer Stichprobe

Beitragvon bele » Mi 12. Okt 2022, 16:13

Hallo BAMJAN,

Es wäre ganz interessant zu wissen, wie groß Deine Stichprobe ist. Geht es (wie meistens) darum, aus wenig Daten möglichst viel Information zu ziehen? Oder sind Daten (durch die Magie des Internets) großzügig vorhanden und es gilt eher, einfach kommunizierbare Ergebnisse mit einfachen Mitteln zu erreichen.

Ist es dann ein zulässiges Verfahren, wenn ich eine einfaktorielle Varianzanalyse errechne, in dem ich meine Stichprobe dem Alter entsprechend in mehrere Gruppen einteile


So etwas kann man machen. Du musst Dir aber sehr bewusst sein, dass die Entscheidung für die Anzahl der Gruppen und die Breite der Alterssgruppen nahezu beliebig gewählt werden kann und dass Du durch diese Wahl das Ergebnis sehr beeinflussen kannst. Was sich hier so einfach liest wird in Wirklichkeit eine Reihe folgenschwerer Entscheidungen ohne gute Entscheidungsgrundlage. Außerdem geht Information verloren und damit sinkt die Power für den statistischen Test. Das würde ich daher wirklich nur machen, wenn Dir kompliziertere Statistik gar nicht passt und Du Rohdaten im Überfluss hast. Wir glauben ja wahrscheinlich alle, dass der Self-Esteem im laufe der Zeit langsam und mehr oder weniger kontinuierlich steigt, während die Unterteilung in Altersgruppen sprungartige Veränderungen an den gesetzten Altersgrenzen modelliert.

Ein Stück besser wäre es, eine einfache lineare Regression zu rechnen. Alter (Einschluss nur von jungen und mittleren Erwachsenen) als Prädiktor, Self-Esteem als Abhängige. Natürlich wird der Zusammenhang in Wahrheit nicht linear sein, aber damit könntest Du einen Trend beweisen (signifikant positive Steigung der bestpassenden Geraden), ohne allzuviele "researcher's degrees of freedom", also ohne Rechtfertigungszwang, warum Du die eine oder die andere Gruppenanzahl gewählt und die Altersgrenzen hier und nicht woanders gezogen hast. Das ist einfach mit jedem Programm zu rechnen und wenn Du eine Gerade in eine Punktwolke einzeichnest versteht auch sofort jeder, was Du da gerechnet hast.

Wenn Dir das mit dem linearen Zusammenhang nicht geheuer ist, dann kannst Du eine gewisse Krümmung der Kurve durch Hinzunahme eines quadratischen Terms erreichen. Also auch wieder Einschluss nur der jungen und mittleren Erwachsenen und dann Vorhersage von Self-Esteen aus dem Alter und dem Quadrat des Alters. Die Statistik ist genauso einfach zu rechnen, Du musst halt zusätzlichen Aufwand treiben, nachher zu zeigen, dass sich über der Basis dieser Altersspanne ein streng positiver Trend zeigt. Du kannst dann eine Kurve zeigen, die mutmaßlich besser zu den Punkten passt. Ob es das wert ist?

Wenn Du vom Leder ziehen willst dann kannst Du den wahrscheinlich-nichtlinearen Zusammenhang zwischen Alter und Self-Esteem auch mit Splines statt einer Geraden oder einer Parabel regredieren. Hängt ein wenig von Deinen Kenntnissen und davon ab, wie leicht es Dir Dein Statistikprogramm macht. Nichtlineare Regression steht halt oft nicht im Anfängerlehrbuch. Wie gut Deine Grundkenntnisse sind und wie gut Du Dir so etwas aneignen könntest hast Du nicht geschrieben.


(Ein anderer Gedanke: Die Daten kommen aus dem Internet -- da kann viel Quatsch gemacht worden sein und es ist mit Ausreißern etc. zu rechnen. Wenn ich die Aufgabe zu lösen hätte, würde ich wahrscheinlich entweder die lineare Regression mit einem robusten Regressionsverfahren oder die Spline-Variante wählen. Das käme dann auf die Details an.)

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5257
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 13
Danke bekommen: 1214 mal in 1202 Posts

folgende User möchten sich bei bele bedanken:
BAMJAN

Re: Einfaktorielle Varianzanalyse an einer Stichprobe

Beitragvon PonderStibbons » Mi 12. Okt 2022, 17:09

Wie will man denn bei solch einer Querschnittserhebung zwischen Alters- und Kohorteneffekten unterscheiden. Die Leute sind nicht nur unterschiedlich alt, sondern wurden auch zu unterschiedlichen Zeiten aufgezogen und sozialisiert.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 10578
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 43
Danke bekommen: 2298 mal in 2283 Posts


Zurück zu Varianzanalysen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast