Multiple Regressionsanalyse

Alle Verfahren der Regressionanalyse.

Re: Multiple Regressionsanalyse

Beitragvon Christopherkch » Mo 31. Okt 2022, 12:30

Hallo Bernhard,

angenommen ich würde eine polynomiale Regression mit 2 Prädiktoren durchführen (nebenbei, ich arbeite mit R) womit ich bei einem Polynom zweiten Grades auf insgesamt 4 Prädiktoren kommen würde, auf welchem Wert im Output müsste ich achten, um zu entscheiden, ob das Modell geeignet ist? Oder: auf welchen Wert würdest du achten, um zu sgaen, dass du dem Modell nicht über den Weg traust? Würde es denn theoretisch nicht reichen, wenn man sich nach Erstellung des Modells den Residualplot sowie R² anschaut?

Zu deinem Hinweis:

Ich möchte den Einfluss bestimmter Parameter auf den Index bestimmen. Ein Modell mit Parametern, welche man in der Regel "zur Hand hat" wäre hilfreich um den Index vorherzusagen bzw zu bestimmen.

VG
Christopher
Christopherkch
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Sa 29. Okt 2022, 22:41
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regressionsanalyse

Beitragvon bele » Mo 31. Okt 2022, 12:49

Christopherkch hat geschrieben:Hallo Bernhard,
angenommen ich würde eine polynomiale Regression mit 2 Prädiktoren durchführen (nebenbei, ich arbeite mit R) womit ich bei einem Polynom zweiten Grades auf insgesamt 4 Prädiktoren kommen würde, auf welchem Wert im Output müsste ich achten, um zu entscheiden, ob das Modell geeignet ist? Oder: auf welchen Wert würdest du achten, um zu sgaen, dass du dem Modell nicht über den Weg traust? Würde es denn theoretisch nicht reichen, wenn man sich nach Erstellung des Modells den Residualplot sowie R² anschaut?

Zu deinem Hinweis:

Ich möchte den Einfluss bestimmter Parameter auf den Index bestimmen. Ein Modell mit Parametern, welche man in der Regel "zur Hand hat" wäre hilfreich um den Index vorherzusagen bzw zu bestimmen.

VG
Christopher


Hi,

Ein Modell der Art
Code: Alles auswählen
z ~ x + I(x^2) + y + I(y^2)


schätzt fünf Koeffizienten, weil man den Intercept mitzählen muss. Wir wären also bei 6 Beobachtungen pro Koeffizient.

Das R^2 bestimmt die Passung in-sample und es steigt mit jedem neuen Prädiktor zuverlässig an, selbst wenn der Prädiktor keine echte Information beisteuern. Das R^2 schützt Dich nicht vor Overfitting. R^2 wird halt aus genau denselben Werten berechnet, die schon zur Bestimmung des Modells genutzt wurden.

Das adjustierte R^2 oder das AIC könnten hilfreich sein. Definitiv auch die Signifikanztests für das Gesamtmodell und die einzelnen Prädiktoren.

Wenn ich die Fragestellung richtig verstehe, dann geht es um einen Modell, das den Index gut vorhersagt, nicht unbedingt um ein Modell, dessen Aufbau die wahren Einflüsse verschiedener Faktoren beschreibt? Ist das so?

LG, Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5766
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1351 mal in 1338 Posts

Re: Multiple Regressionsanalyse

Beitragvon Christopherkch » Mo 31. Okt 2022, 15:35

Hallo!

Eine Vorhersage wäre das Ziel. Ist dabei der Einfluss nicht aber entscheidend?

Im Internet bin ich auf einen Rechner gestoßen, der die Stichprobengröße bei unterschiedlichen Vorraussetzungen ermittelt (Wahrscheinlich kennst du ihn):
https://statistikguru.de/rechner/powera ... ssion.html

Gebe ich hier für
R2 = 0.5
Anzahl Prädikatoren = 7

bei Alpha 0.5 und power 0.9 ein, komme ich auf 27. Wie ist das zu verstehen? Demnach sollten doch sogar 6 koeffizienten (also 3 Prädikatoren bei einem Polynom 2. Grades) möglich sein, oder?

An dieser Stelle ein großes Dankeschön für deine Geduld!

VG

Christopher
Christopherkch
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Sa 29. Okt 2022, 22:41
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regressionsanalyse

Beitragvon bele » Mo 31. Okt 2022, 16:48

Hi,

Christopherkch hat geschrieben:Eine Vorhersage wäre das Ziel. Ist dabei der Einfluss nicht aber entscheidend?


Im einfachen linearen Modell nicht ganz, aber die Welt ist voll von Alternativen wie der LASSO Regression oder randomForests bei denen der Zufall eine ordentliche Rolle spielt, sodass man der Gewichtung einzelner Prädiktoren nicht zu sehr glauben sollte, die aber auch unter schwierigen Bedingungen passable Vorhersagen erlauben können und die sich aus zehn Prädiktoren die heraussuchen, die sie brauchen. RandomForests können auch erheblich nicht-lineare Zusammenhänge abbilden.

Im Internet bin ich auf einen Rechner gestoßen, der die Stichprobengröße bei unterschiedlichen Vorraussetzungen ermittelt (Wahrscheinlich kennst du ihn):


Nein, kannte ich nicht. Wenn Du ein wahres R^2 von 50% haben solltest, kannst Du zu 90% nachweisen, dass dieses Modell besser ist als einfach nur den Mittelwert der Ergebnisse zu nehmen. :? :(

Sowohl zu LASSO also auch zu random forests gibt es bestimmt gute Youtube Videos von StatQuest. Zu LASSO und dem R Paket glmnet habe ich mal einen sehr schönen Vortrag von Trevor Hastie gesehen, ich glaube, es war dieser hier: https://youtu.be/BU2gjoLPfDc (YMMV, ich sage nicht, dass das Deine Probleme lösen würde. Aber vielleicht sollte man davon gehört haben, wenn man eine prädiktives öineares Modell erstellen will und zuviele Variablen hat).

Random Forests kann man u.a. mit dem R Paket randomForest erstellen. Wenn das das passende Verfahren wäre, dann wäre es recht leicht anzuwenden.

LG, Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5766
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1351 mal in 1338 Posts

folgende User möchten sich bei bele bedanken:
Christopherkch

Vorherige

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast