Seite 1 von 1

Multiple Lineare Regression mit Bootstrapping

BeitragVerfasst: Sa 17. Apr 2021, 18:39
von jana_msh
Hallo zusammen,

ich habe eine Multiple Lineare Regression (MLR) mit Bootstrapping durchgeführt.
Bootstrapping habe ich benutzt, da meine Residuen nicht normalverteilt waren und somit eine Annahme der MLR verletzt ist.

SPSS spuckt mir jetzt 2 Tabellen aus: 'Koeffizienten' und 'Bootstrap für Koeffizienten'. Siehe Beispielbild anbei.

Die Zahlen sind war sehr ähnlich aber trotzdem unterschiedlich. Welchen Output muss ich in meiner Thesis beschreiben?
Wichtig sind mir die Signifikanzen (p-values) und Koefizienten.

DANKE!

Viele Grüße,
Jana

Re: Multiple Lineare Regression mit Bootstrapping

BeitragVerfasst: Sa 17. Apr 2021, 20:18
von strukturmarionette
Hi,

- zunächst berichten den Stichprobenumfang hier

Gruß
S.

Re: Multiple Lineare Regression mit Bootstrapping

BeitragVerfasst: Sa 17. Apr 2021, 20:20
von PonderStibbons
Bootstrapping habe ich benutzt, da meine Residuen nicht normalverteilt waren und somit eine Annahme der MLR verletzt ist.

Das ist bei einer Stichprobengröße ab ca. n > 30 nicht von Belang.
SPSS spuckt mir jetzt 2 Tabellen aus: 'Koeffizienten' und 'Bootstrap für Koeffizienten'. Siehe Beispielbild anbei.
Die Zahlen sind war sehr ähnlich aber trotzdem unterschiedlich. Welchen Output muss ich in meiner Thesis beschreiben?
Wichtig sind mir die Signifikanzen (p-values) und Koefizienten.

Ich kann dem insegesamt keider nicht ganz folgen. Dies ist kein SPSS-Forum. & ich sehe kein Bild.

Mit freundlichen Grüßen

PonderStibbons

Re: Multiple Lineare Regression mit Bootstrapping

BeitragVerfasst: Sa 17. Apr 2021, 21:38
von jana_msh
Hallo zusammen,

meine Stichprobe sind 289 Fälle.
Ich muss leider alles mit Literatur begründen und habe nichts dazu gefunden, dass die Normalverteilungsannahme der Residuen bei einer gewissen Stichprobengröße hinfällig ist..

Ich kann aktuell leider, warum auch immer, kein Bild hochladen :/

TABELLE 1:

Koeffizientena
Modell Nicht standardisierte Koeffizienten Standardisierte Koeffizienten T Sig.
RegressionskoeffizientB Std.-Fehler Beta
1 (Konstante) 12.210 1.550 7.880 0.000
Connection to region -0.398 0.183 -0.132 -2.176 0.030


TABELLE 2:

Bootstrap für Koeffizienten
Modell RegressionskoeffizientB Bootstrapa
Verzerrung Std.-Fehler Sig. (2-seitig) BCa 95% Konfidenzintervall
Unterer Oberer
1 (Konstante) 12.210 0.082 1.581 0.000 9.069 15.671
Connection to region -0.398 0.004 0.175 0.025 -0.721 -0.051

Das sind die beiden Tabellen. Ich habe nur einen unabhängige Variable (connection to region) drinnen gelassen und der Übersichtlichkeit wegen alle anderen gelöscht.

Re: Multiple Lineare Regression mit Bootstrapping

BeitragVerfasst: Sa 17. Apr 2021, 22:38
von PonderStibbons
Ich muss leider alles mit Literatur begründen und habe nichts dazu gefunden, dass die Normalverteilungsannahme der Residuen bei einer gewissen Stichprobengröße hinfällig ist..

Zentraler Grenzwertsatz. S.a. FAQ #4 in https://psychologie.uni-graz.at/de/biol ... -list/faq/

Davon ab, weiß ich nicht, wieso Du die Frage stellst. Wenn Du meinst, bootstrap ist erforderlich, dann berichtest
Du dessen Ergebnis. Wenn nicht, dann das Ergebnis der "normalen" Analyse.

Mit freundlichen Grüßen

PonderStibbons

Re: Multiple Lineare Regression mit Bootstrapping

BeitragVerfasst: Mo 14. Jun 2021, 15:09
von Manuelisus
Nach Bühner & Ziegler (2009, S. 674) ist erst bei Abwesenheit von residuellen Außreißern und zu-gleich 100 Fällen pro Bedingung eine Verletzung der Normalverteilung von Residduen als weniger problematisch bei Regressionsanalysen einzustufen Lumley, Diehr, Emerson und Chen (2002)

Entsprechend kann man nicht davon ausgehen das bei N = 30 die Residduen sich langsam der Normalverteilung annähern.

Andere Autoren schließen den zentralen Grenzwertsatz sogar vollständig aus.
Der zentrale Grenzwertsatz (CLT) sagt nichts über die Verteilung der Residuen in einem statistischen Modell aus.† Sie können normal sein oder nicht, abhängig von der zugrunde liegenden Verteilung der Fehlerterme. Der CLT ist ein Theorem, das die asymptotische Verteilung des standardisierten Stichprobenmittelwerts und anderer standardisierter Größen betrifft, die durch Summation von Variablen gebildet werden. Er wird leider so expansiv fehlinterpretiert, dass er auf alle möglichen Größen angewandt wird, auf die er nicht zutrifft. Die Fehlinterpretation der CLT als Behauptung der asymptotischen Normalität der zugrunde liegenden Werte, die im Modell verwendet werden, ist leider ein allgegenwärtiger Fehler.

Re: Multiple Lineare Regression mit Bootstrapping

BeitragVerfasst: Mo 14. Jun 2021, 21:52
von PonderStibbons
Allerdings verstehe ich das Argument nicht ganz.

https://en.wikipedia.org/wiki/Central_l ... Regression
Regression analysis and in particular ordinary least squares specifies that a dependent variable depends according to some function upon one or more independent variables, with an additive error term. Various types of statistical inference on the regression assume that the error term is normally distributed. This assumption can be justified by assuming that the error term is actually the sum of many independent error terms; even if the individual error terms are not normally distributed, by the central limit theorem their sum can be well approximated by a normal distribution.

Nebenbei geht es sowieso nicht darum, dass Residuen sich der Normalverteilung annähern (das kann nicht sein),
sondern ob die Standardfehler korrekt geschätzt werden.

Eine lineare Regression mit 1 binären Prädiktor ist übrigens vollkommen äquivalent einem t-Test.

Eine Reihe von Simulationsstudien konnte zeigen, dass nicht-normal verteilte Residuen bereits bei kleinen
Stichproben in der Regel kein Problem darstellen.

https://blog.minitab.com/en/adventures- ... n-analysis
https://www.jclinepi.com/action/showPdf ... %2930485-7
https://www.biorxiv.org/content/10.1101/498931v2.full

Mit freundlichen Grüßen

PonderStibbons