Seite 1 von 1

Regressionsanalyse trotz mangelndem Zusammenhnang

BeitragVerfasst: Di 30. Sep 2014, 11:11
von Bronnert-Härle
Hallo!
Ich habe zwei Fragen
1. Frage: Ich habe ein Regressions-Modell, das ich aus der Theorie abgeleitet habe...bei Überprüfung der Zusammenhänge korrelieren 3 der 5 Prädiktoren untereinander hoch aber nicht mit dem Kriterium..jetzt weiß ich nicht ob ich das Modell trotzdem rechnen soll...denn trotz mangelnder Korrelation hab ich das Modell ja aus der Theorie abgeleitet? Wenn ich es also rechnen sollte ist die Frage ob ich dann einzeln mit je einem Prädiktor die Regression rechne oder blockweise?

2. Frage: Ich habe die Vermutung dass es bei einigen Variablen Ausreißer gibt...jetzt habe ich gelesen dass man sich bei der linearen Regression Distanz-Maße ausgeben lassen kann und anhand dieser Ausreißer identifizieren kann, zB Leverage-Werte, Mahalanobis-Wert, DFFITS oder Cooksche Distanz...welche Werte sind denn da relevant?

Es wäre toll wenn mir jemand weiterhelfen könnte!

VG

Re: Regressionsanalyse trotz mangelndem Zusammenhnang

BeitragVerfasst: Di 30. Sep 2014, 12:04
von DHA3000
1a. Was heißt "hoch"?

1b. Theorie und Praxis passen nicht immer zueinander. Man sollte nicht mit Gewalt versuchen, sie zusammen zu führen.

1c. Es gibt genügend Möglichkeiten zur Selektion: Stichwort Informationkriteria.

2. Schon einmal die Daten angeschaut?

Re: Regressionsanalyse trotz mangelndem Zusammenhnang

BeitragVerfasst: Di 30. Sep 2014, 14:03
von Bronnert-Härle
Danke für deine Antwort!
zu 1a: die Korrelationen sind signifikant, wenn ich aber eine Regressionsanalyse rechne liegen die Toleranzwerte meist so bei .744 oder .581 und die VIF-Werte so bei 1.722...dann müsste doch eine Kollinearität der Prädiktoren unwahrscheinlich sein?

zu1b: Ok, aber wäre es nicht auch ein Ergebnis wenn ich eine Regression rechne und schreibe dass keiner der Prädiktoren einen signifikanten Einfluss auf die AV hat bzw. nicht zur Vorhersage beiträgt?

zu2: ja, ich habe mir die Daten schon angeschaut...ich frage mich aber jetzt was die beste und angesehenste Methode ist die Ausreißer zu identifizieren...eine visuelle Überprüfung mittels Box-Plots oder Streudiagramm erscheint mir nicht ausreichend...

Re: Regressionsanalyse trotz mangelndem Zusammenhnang

BeitragVerfasst: Di 30. Sep 2014, 15:59
von DHA3000
1a: Joa, Multikollinearität sollte nicht einen so großen Einfluss haben. Du kannst dies aber eher daran sehen, dass deine erklärenden Variablen signifikant sind, wenn du sie einzeln evaluierst und sie sich im gesamten Modell gegenseitig aufheben. Vergsiss den VIF oder Signifikanztests auf Korrelation.

1b: Nun, wenn du Multilolinearität vorliegen hast, dann wäre dein Rückschluss falsch, denn es gäbe sehr wohl einen signifikanten Einfluss, welcher allerdings durch eine fehlerhafte Schätzmethode nicht entdeckt wird.

2: Im Zweifel führen Ausreißer dazu, dass deine Residuen nicht White Noise sind. Du solltest also erst einmal daran anknüpfen.

Re: Regressionsanalyse trotz mangelndem Zusammenhnang

BeitragVerfasst: Di 30. Sep 2014, 17:22
von Bronnert-Härle
1a: Ja, die Antwort erstehe ich...wenn ich die Variablen einzeln, bereinigt von Ausreißern (habe die jetzt einfach erstmal anhand der Distanzmaße identifiziert), evaluiere sind 2 der 5 Prädiktoren signifikant..woraus man schließen würde dass doch, obwohl die Toleranzwerte im Rahmen sind Kollinearität vorliegt, richtig? Wenn dem so ist, wie gehe ich denn dann weiter vor? Vergleiche ich einfach die beiden Regressionsmodelle der signifikanten Prädiktoren und gucke welches besser ist? Oder sollte ich doch besser eine Hauptkomponentenanalyse rechnen?

2: White Noise der Residuen sagt mir nichts..ich muss wohl noch sehr viel lernen...was bedeutet das denn?

LG

Re: Regressionsanalyse trotz mangelndem Zusammenhnang

BeitragVerfasst: Mi 1. Okt 2014, 09:14
von bele
Wenn Du eine lineare Regression rechnest, dann gibt Dein Rechner Dir in irgendeiner Form die Residuen aus. Diese solltest Du plotten und visuell beurteilen, ob sie zufällig (normal-)verteilt sind (White Noise heißt hier völlig zufällige Verteilung). Falls einige Deiner Daten in besonderer Weise nicht zum Modell passen, dann produzieren sie besonders große Residuen.