Seite 1 von 1

Multikollinearität im Multivariaten Regressionsmodel

BeitragVerfasst: Di 2. Jan 2018, 12:51
von SirofFinance
Sehr geehrte Mitleser,

ich versuche gerade Haus Preise über verschieden Variablen zu erklären. Gegeben Variablen sind z.B. "Anzahl der Bäder", "Quadrat-Meter", "Anzahl der Garagen" usw.

Beim rumspielen habe ich eine neue Variable zusammengestellt, "Preis pro Quadratmeter". Konsequenz ist, dass alle Variablen die davor signifikant waren, mit p-values < 0.01, jetzt insignifikant sind, mit p-values > 0.10. Mein Adjusted R-Square ist von 0.83 auf 0.98 gestiegen. Die Kombination dieser Ereignissen hinterlässt bei mir den bitteren Beigeschmack, dass die Variable "Preis pro Quadratmeter" gegen irgendein statistisches Konzept verstößt, das diese nur eine lineare Transformation der zu erklärenden Variable ist. Wäre dies ein Fall von Multikollinearität oder eine andere Statistische Sünde? :twisted:

Re: Multikollinearität im Multivariaten Regressionsmodel

BeitragVerfasst: Di 2. Jan 2018, 12:59
von strukturmarionette
Hi,

- es fehlen u.a. Stichproben- und konkrete Variablenbeschreibungen.

Beim rumspielen habe ich eine neue Variable zusammengestellt,

- hmm?

Gruß
S.

Re: Multikollinearität im Multivariaten Regressionsmodel

BeitragVerfasst: Di 2. Jan 2018, 13:14
von SirofFinance
Hallo,
- es fehlen u.a. Stichproben- und konkrete Variablenbeschreibungen.


Alle gegeben Variablen, abgesehen vom Haus-Preis, sind:

1. Quadrat-Meter
2.Anzahl der Bäder
3.Anzahl der Garagen
4.Anzahl der Zimmer
5.Alter des Hauses
6.Größe des Grundstückes

Variablen 3,4 und 5 konnte ich eliminieren, da diese riesige p-values hatten (>0.80). Die übrigen Variablen haben alle sehr kleine P-Values. Zu diesem Moment habe ich dann auch einen adjusted R-Square von 0.83

Ich habe für die die neue Variable "Preis pro Quadratmeter", einfach den "Preis des Hauses" durch die "Quadrat-Meter" geteilt. D.h. ich teile die zu erklärende Variable durch eine erklärende Variable.

Ich arbeite mit einem Sample Size von n=60.

Liebe Grüße.

Re: Multikollinearität im Multivariaten Regressionsmodel

BeitragVerfasst: Di 2. Jan 2018, 14:14
von strukturmarionette
Hi,

- Was ist (sind) jetzt Deine konkrete(n) Frage(n)?

Gruß
S.

Re: Multikollinearität im Multivariaten Regressionsmodel

BeitragVerfasst: Di 2. Jan 2018, 18:55
von bele
strukturmarionette hat geschrieben:
Beim rumspielen habe ich eine neue Variable zusammengestellt,

- hmm?

Das heißt nicht "rumspielen", das heißt "explorative Datenanalyse" :lol:

Stell Dir mal vor, alle Häuser hätten die gleiche Wohnfläche, die Quadratmeter wären also konstant. Dann würdest Du den Preis vorhersagen aus dem Preis geteilt durch eine Konstante. Das führt zu 100% Varianzaufklärung, macht aber keinen schlauer. Wenn Du nicht irrsinnig viel Varianz in der Wohnfläche hast oder einen sehr guten inhaltlichen Grund, warum Dich diese Berechnung interessiert, dann würde ich es tatsächlich für eine Statistiksünde halten, den Preis auf beiden Seiten der Gleichung, also sowohl bei den Prädiktoren als auch als Zielvariable einzusetzen.

Grundsätzlich geht es aber nicht um die Frage, was eine Sünde ist, sondern um die Frage, wem eine Regression nützt, die den Preis vorhersagt, wenn man sowohl Preis pro Fläche als auch Fläche kennt. Dafür braucht man keine Regressionsrechnung, dafür reicht Rechnen Klasse 5 oder 6 völlig aus.

Hast Du mal einen Interaktionsterm aus Preis pro Fläche und Fläche ins Modell aufgenommen? :lol:

LG,
Bernhard

Re: Multikollinearität im Multivariaten Regressionsmodel

BeitragVerfasst: Di 2. Jan 2018, 22:26
von strukturmarionette
Hi,

im Multivariaten Regressionsmodel

- Was ist das Deiner Meinung nach?

Gruß
S.