Stichprobengröße bei multipler Regression mit 5 Prädiktoren

Alle Verfahren der Regressionanalyse.

Stichprobengröße bei multipler Regression mit 5 Prädiktoren

Beitragvon Johnny-the-Monkey » Sa 22. Okt 2022, 21:17

Hallo liebes Forum,

Für meine Masterarbeit führe ich gerade eine multiple lineare Regression mit einer AV und fünf UVs durch. Ziel ist es die Einflüsse einzelner Faktoren auf die Arbeitszufriedenheit einer spezifischen Berufsgruppe zu schätzen. Die Stichprobengröße ist mit n=26 relativ klein. Wenn ich die Einflüsse der Faktoren auf die Arbeitszufriedenheit einzeln in einfachen linearen Regression untersuche sind die p Werte der Regressionsmodelle signifikant. Sobald ich die Einflüsse in einem multiplen Regressionsmodell auf einmal untersuche, ist das Modell an sich immer noch signifikant (mit einem R² von 0,6), die Regressionskoeffizienten aber hoch insignifikant und die Einflüsse sehr klein (einmal war ein Koeffizient sogar negativ welcher vorher positiv war).
Durch vorherige Analysen bin ich mir relativ sicher, dass die UVs untereinander korrelieren, die Berechnung der Variance Inflation Factors ergab jedoch Werte zwischen 2 und 3, welche laut Forschung eigentlich noch als "ok" gelten.
Nun wäre meine Frage, ob die Stichprobengröße von nur 26 Probanden für die extremen Insignifikanzen verantwortlich sein kann oder ob die Stichprobe generell zu klein ist für eine multiple Regression mit 5 Faktoren? Leider konnte ich soweit keine eindeutigen Antworten finden.

Vielen Dank schonmal im Voraus und liebe Grüße :)
Johnny-the-Monkey
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Sa 22. Okt 2022, 15:34
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Stichprobengröße bei multipler Regression mit 5 Prädikto

Beitragvon bele » Sa 22. Okt 2022, 21:41

Hallo,

die Kombination aus kleiner Stichprobe und Multikollinearität ist sicher ungünstig. Das Modell weiß nicht, ob es die Varianz durch den einen oder den anderen oder den dritten Prädiktor erklären soll und deshalb wird am Ende keiner von ihnen signifikant.

Beim VIF versucht man, den einen Prädiktor durch die anderen vorherzusagen. Der Stichprobenumfang geht in die Berechnung des VIF also gar nicht wirklich ein.
Die Empfindlichkeit Deiner Regression gegenüber Multikollinearität hängt dagegen sehr vom Stichprobenumfang ab. Faustregel wie VIF < 10 können für sehr kleine oder sehr große Stichproben unpassend sein.

LG, Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5766
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1351 mal in 1338 Posts

folgende User möchten sich bei bele bedanken:
Johnny-the-Monkey

Re: Stichprobengröße bei multipler Regression mit 5 Prädikto

Beitragvon Johnny-the-Monkey » So 23. Okt 2022, 10:02

Hallo Bernhard,

Danke für die schnelle Antwort,
Ich glaube Maxwell (2000) hat sich mit der Thematik bezüglich Stichprobengröße in Abhängigkeit von Korrelation der UVs untereinander und der UV-AV Korrelation beschäftigt. Unklar war mir, dass der Stichprobenumfang nicht in die Berechnung des VIF eingeht sowie dass die Faustregel <10 für sehr kleine oder sehr große Stichproben unpassend sein kann.
Vielen Dank für die Aufklärung.

Liebe Grüße
Johnny-the-Monkey
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Sa 22. Okt 2022, 15:34
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Stichprobengröße bei multipler Regression mit 5 Prädikto

Beitragvon bele » So 23. Okt 2022, 10:10

Hallo Jonny,

man versucht einen Prädiktor durch die anderen Prädiktoren vorherzusagen und nur das R-Quadrat davon geht in das VIF ein. Les' Dir das mal durch, das ist wirklich nicht kompliziert und auch für uns Normalmenschen verständlich.

Die offene Frage ist, wie Du jetzt weiter machst und das hängt davon ab, was genau Du wissen willst. Reichen die bivariaten Abhängigkeiten?

LG, Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5766
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1351 mal in 1338 Posts

folgende User möchten sich bei bele bedanken:
Johnny-the-Monkey

Re: Stichprobengröße bei multipler Regression mit 5 Prädikto

Beitragvon Johnny-the-Monkey » So 23. Okt 2022, 15:53

Danke für deine Antwort !

Ja das mit den VIF macht Sinn, ich habe mir die Formel zur Berechnung des VIF nochmal angeschaut und weitestgehend verstanden.

Zum Ausreichen der bivariaten Abhängigkeiten:
Im Prinzip geht es darum den Einfluss einer Dimension eines Konstrukts gesondert zu untersuchen. Die Aussage dass dieser einen signifikanten Einfluss hat lässt sich schwer rechtfertigen wenn andere bekannte Einflüsse (weitere Dimensionen des Konstrukts) nicht kontrolliert werden. Deshalb wurden ebenfalls die anderen gemessene Dimensionen die maßgeblichen Einfluss auf die Arbeitszufriedenheit haben können in einer multiplen Regression einbezogen.

Ich denke ich habe die Möglichkeit zu sagen, dass in der einfachen linearen Regression Tendenzen eines signifikanten Zusammenhangs erkennbar sind, die aber aufgrund der Stichprobengröße und der Multikollinearität schwer eindeutig in einer multiplen Regression bestätigt werden können, weil andere Faktoren auch dafür verantwortlich sein könnten.
Ebenfalls konnte aufgrund der kleinen Stichprobengröße keine PCA/Faktorenanalyse im Vorfeld durchgeführt werden um somit Dimensionen eindeutig voneinander abzugrenzen und Multikollinearität zu verringern.

Dann nehme ich an dass ich der einfachen linearen Regression Ergebnisse rausbekomme, die bis zu einem gewissen Grad unscharf sind.
Johnny-the-Monkey
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Sa 22. Okt 2022, 15:34
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Stichprobengröße bei multipler Regression mit 5 Prädikto

Beitragvon bele » So 23. Okt 2022, 16:04

Ist das so? Kann man mit 26 Beobachtungen wirklich keine PCA rechnen? Oder ist die PCA nur nicht in der Lage, Dein Problem zu lösen?

LG, Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5766
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1351 mal in 1338 Posts

folgende User möchten sich bei bele bedanken:
Johnny-the-Monkey

Re: Stichprobengröße bei multipler Regression mit 5 Prädikto

Beitragvon Johnny-the-Monkey » Mo 24. Okt 2022, 09:34

Ich bin von den Empfehlungen von ca. 10 Fällen pro Item ausgegangen. Wenn ich von diesen Empfehlungen ausgehe, würde ich ca. 200 Probanden benötigen um bei einer PCA aussagekräftige Ergebnisse zu bekommen. Ich nehme an ich könnte eine PCA rechnen, aber würden sie sagen eine PCA könnte dazu beitragen das Problem zu lösen? Ich bin mir nicht sicher welche Ergebnisse diese liefern würde.

LG, Johnny :)
Johnny-the-Monkey
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Sa 22. Okt 2022, 15:34
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Stichprobengröße bei multipler Regression mit 5 Prädikto

Beitragvon bele » Mo 24. Okt 2022, 09:51

Nein, soweit ich das bisher gehört habe, klingt das schon gut: Diese Prädiktoren haben gemeinsam eine signifikante Beziehung zur UV und weil sie untereinander korrelieren ist es im Rahmen der erzielbaren Stichprobe nicht möglich, die Beziehung einzelner Prädiktoren auch unter Berücksichtigung der anderen festzustellen.

LG, Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5766
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1351 mal in 1338 Posts

folgende User möchten sich bei bele bedanken:
Johnny-the-Monkey


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste