Seite 2 von 2

Re: Negativer Intercept und hoher p-wert

BeitragVerfasst: Do 8. Dez 2016, 10:50
von bele
Hallo amelie,

nicht-normalverteilte Residuen besagen, dass das lineare Modell nicht gut zu Deinen Daten passt. Alle Aussagen, die Du aus dem linearen Modell ableitest sind nur so gut, wie die Daten zum Modell passen. Was das in Deinem konkreten Fall bedeutet kann nur sagen, wer Deinen konkreten Fall kennt.

amelie94 hat geschrieben:1. Kann ich dies einfach über den Befehl shapiro.test() testen ? bzw. für den fall 1+2: shapiro.test(lm(formula = w3 ~ z)$resid)
(wobei der P-Wert möglichst größer sein sollte, als das Signifikanzniveau)

Der Shapiro-Test kann helfen, ist aber für sich allein genommen zu wenig für eine wohl-abgewogene Entscheidung. Der Test wird halt bei ganz kleinen Datensätzen nicht positiv und bei großen wegen geringster Abweichungen von der Normalität. Die Wichtigkeit der Normalität von Residuen geht aber genau anders herum: je kleiner n, umso wichtiger.
Besser ist oft eine graphische Kontrolle mit einem Quantile-Quantile-Plot, z. B.

Code: Alles auswählen
w3<- c( 17484.0, 18225.0, 19023.0, 19137.0, 20704.5, 23209.5, 27904.5, 36397.5, 49848.0,
        34053.0, 33571.5, 32773.5, 36606.0, 38230.5, 40564.5, 40383.0, 38601.0)
z <- c(3.9, 3.9, 3.9, 3.9, 3.9, 4.6, 5.3, 6.1, 7.4, 6.9, 6.4, 6.6, 6.7, 6.8, 7.5, 8.2, 8.7)

re <- lm(w3~z)$residuals
qqnorm(re)
qqline(re)

(Hinweis: nach Quantile-Quantile-Plots googlen, damit der Plot sich erschließt. Datenpunkte 9 und 17 fallen aus der Reihe.)

Reden wir immer noch von w3 und z aus Deinem Eingangsbeispiel? Ist Dir folgendes aufgefallen?
Code: Alles auswählen
> shapiro.test(lm(log(w3)~log(z))$residuals)

   Shapiro-Wilk normality test

data:  lm(log(w3) ~ log(z))$residuals
W = 0.96562, p-value = 0.7381


LG,
Bernhard

Re: Negativer Intercept und hoher p-wert

BeitragVerfasst: Do 8. Dez 2016, 12:42
von amelie94
Vielen Dank nochmal Bernhard !
z sind übrigens Preise und w3 die dazugehörigen gekauften Mengen. Hätte ich wohl schon früher erwähnen sollen. Sorry dafür :cry:

Reden wir immer noch von w3 und z aus Deinem Eingangsbeispiel? Ist Dir folgendes aufgefallen?


Also ich hab jetzt eine Zeit lang gegoogelt , weiß aber nicht worauf das abzielen soll. Heißt das, dass eine normalverteilte Logarithmusfunktion die Daten besser beschreibt als eine lineare Beziehung?

Re: Negativer Intercept und hoher p-wert

BeitragVerfasst: Do 8. Dez 2016, 15:58
von bele
Hallo Amelie,

ich weiß ja nicht, was Du da machst und wozu Du die Regression in welchem Kontext brauchst. Wenn das eine Qualifizierungsarbeit ist, bei der Du Deinem Prof zeigen musst, was Du gelernt hast und wenn der auf normalverteilte Residuen steht, dann kannst Du den Logarithmus der Verkaufsmenge durch den Logarithmus des Preises vorhersagen und bist Dein Residuenproblem los. Wenn Du eine Regression aufmachst, aus der Du echte ökonomische Schlüsse ziehen willst, dann bist Du mit Deinen paar wenigen Datenpunkten und ohne Berücksichtigung anderer Einflussfaktoren ohnehin vorsichtig bei der Bewertung Deiner Ergebnisse und es kommt dann darauf auch nicht mehr an.

LG,
Bernhard

Re: Negativer Intercept und hoher p-wert

BeitragVerfasst: Do 8. Dez 2016, 16:39
von amelie94
Und nochmals danke !
Nein es geht nicht um echte ökonomische Schlüsse. Es handelt sich um eine kleiner einführende empirische Arbeit bei der lediglich gezeigt soll, dass man mit einigen Grundlagen umgehen kann. Nichts weltbewegendes, Fehler dürfen passieren.

Re: Negativer Intercept und hoher p-wert

BeitragVerfasst: Sa 31. Dez 2016, 11:52
von DHA3000
Wie bele oben schon geschrieben hat: Du hast viel zu wenig Beobachtungen. Da wird nie etwas normalverteilt sein.