Seite 1 von 1

Auswertung Regressionsanalyse

BeitragVerfasst: Mi 28. Mai 2014, 19:36
von leonie111
Hallo zusammen!

Ich brauche dringend Hilfe bei der Auswertung einer Regressionsanalyse, die ich im Rahmen meiner Bachelorarbeit durchführen muss.

Und zwar geht es um den Einfluss der Aktivitäten eines Unternehmens auf Facebook und Pinterest auf die Anzahl der Besuche des Onlineshops des Unternehmens.
Ich führe zum ersten Mal eine Regression durch, daher bin ich sehr unsicher was die Auswertung angeht. Allerdings befürchte ich, dass die Werte sehr schlecht sind.

Im Anhang findet ihr einen screenshot der Auswertung.

Ich bräuchte einmal eure Hilfe bei der Auswertung.

Also im Folgenden mal meine Interpretation.

-Also das korrigierte R2 ist relativ klein. Das heißt dass nur ein geringer Teil der Streuung durch die unabh. Variablen erklärt werden kann. (Es haben also noch andere Dinge einen Einfluss auf die abhängige Variable?!)
-Was ich positiv interpretieren würde ist, dass ich durch die Durchführung des F-Test feststellen kann, dass das geschätzte Modell auch über die Stichprobe hinaus Gültigkeit für die Grundgesamtheit besitzt.

-Bezüglich des T-Test lässt sich sagen, dass die unabh. variablen comment, clicks, impressions pin und repins keinen signifikanten Einfluss auf die abhängige Variable haben. Die anderen unabhängigen Variablen haben einen signifikanten Einfluss.

Sind diese Interpretationen soweit korrekt?

Was mich sehr beunruhigt ist, dass der Standardfehler der Schätzung so riesig ist.
Ist diese Auswertung kompletter Müll oder kann ich mich auf die Interpretation des F-Tests und T-Test stützen?
Es geht ja darum anzugeben, ob die unabhängigen Variablen einen Einfluss auf die Anzahl der Visits im Onlineshop haben.

Ihr würdet mir mit einem kurzen Feedback wirklich helfen. Ich habe bisher noch nie eine Regression durchgeführt.

Danke schonmal!

Re: Auswertung Regressionsanalyse

BeitragVerfasst: Mi 28. Mai 2014, 19:54
von PonderStibbons
*

Re: Auswertung Regressionsanalyse

BeitragVerfasst: Mi 28. Mai 2014, 20:10
von leonie111
]Danke für die schnelle Antwort!

Das "dringend" war ein bisschen übertrieben. Ich habe noch etwa zwei Monate Zeit bis zur Abgabe der Arbeit.

Ich habe nochmal eine Datei angehängt, vielleicht ist die Auswertung jetzt zu sehen.

Ja, ich meinte das adjustierte R2. Dies liegt nur bei ,453.

Insgesamt waren es 14 unabhängige Variablen, deren Einfluss ich testen wollte.

Ich habe für die Auswertung die jeweiligen Beobachtungen von 302 Tagen verwendet.

auswertung.xlsx
(61.54 KiB) 234-mal heruntergeladen

Re: Auswertung Regressionsanalyse

BeitragVerfasst: Mi 11. Jun 2014, 13:15
von leonie111
Hallo nochmal,

ich habe nun die Daten auf Multikollinearität getest und extrem hohe Korrelationen herausbekommen (teilweise .973).
Ist meine Regressionsanalyse damit hinfällig oder kann man diese trotzdem verwenden?

Wenn nicht, gibt es eine Möglichkeit, etwas gegen die Multikollinearität zu tun?

Danke für eure Hilfe.

Re: Auswertung Regressionsanalyse

BeitragVerfasst: Mi 11. Jun 2014, 17:15
von Albrecht
Ja, wen zwei Variablen starkt miteinander korrelieren, sollte eine davon entfernt werden.

Re: Auswertung Regressionsanalyse

BeitragVerfasst: Mi 11. Jun 2014, 17:20
von daniel
wen zwei Variablen starkt miteinander korrelieren, sollte eine davon entfernt werden.


Entschiedenes Veto! Dadurch ist ein omitted variable bias garantiert.

Kollinearität ist kein "Problem" per se. Das "Problem" wird durch die hohen Standardfehler akkurat repräsentiert. Wenn hoch korrelierte Variablen das gleiche theoretische Konstrukt abilden, kann man über Dimensionsanalytische Verfahren zur Zusammenfassung der relevanten Variablen nachdenken.

Re: Auswertung Regressionsanalyse

BeitragVerfasst: Mi 11. Jun 2014, 19:01
von leonie111
Danke für eure Antworten!

Ich finde in der Literatur verschiedene Angaben darüber, welche Werte eine schwache/ mittlere/ starke/ sehr starke Korrelation zeigen.
Gibt es da eine Art "allgemeingültige" Regel?
Ich weiß nicht wirklich, ob ich bei meiner Regression bleiben kann, oder ob ich eventuell Variablen rausnehmen sollte, die besonders hoch korrelieren.

Re: Auswertung Regressionsanalyse

BeitragVerfasst: Mi 11. Jun 2014, 22:20
von Albrecht
"Kollinearität ist kein "Problem" per se. Das "Problem" wird durch die hohen Standardfehler akkurat repräsentiert."
Führt aber dazu, dass die Regressionskoeffizienten bedeutungslos sind.

"Ich finde in der Literatur verschiedene Angaben darüber, welche Werte eine schwache/ mittlere/ starke/ sehr starke Korrelation zeigen."
Einerseits gibt es da keine allgemeingültigen Regeln, andererseits wirst Du für das konkret "ich habe nun die Daten auf Multikollinearität getest und extrem hohe Korrelationen herausbekommen (teilweise .973)." keine zwei Meinungen finden können. Das ist eine sehr starke Korrelation.

"Ich weiß nicht wirklich, ob ich bei meiner Regression bleiben kann, oder ob ich eventuell Variablen rausnehmen sollte, die besonders hoch korrelieren."
Ich würde mich erstmal fragen, wieso ich so viele hoch korrelierende Werte habe`? Warum hat man so viele Variablen im Modell, die praktisch das gleiche messen?

Wenn man dennoch mit allen Variablen weitermachen möchte, könnte man Daniels Vorschlag aufgreifen:
"Wenn hoch korrelierte Variablen das gleiche theoretische Konstrukt abilden, kann man über Dimensionsanalytische Verfahren zur Zusammenfassung der relevanten Variablen nachdenken." -> Da kann man eine Hauptkomponentenanalyse durchführen, welche die korrelierende Faktoren zusammenführt, da ist dann die Multikollinearität auch kein Problem!

Re: Auswertung Regressionsanalyse

BeitragVerfasst: Mi 11. Jun 2014, 23:12
von daniel
"Kollinearität ist kein "Problem" per se. Das "Problem" wird durch die hohen Standardfehler akkurat repräsentiert."
Führt aber dazu, dass die Regressionskoeffizienten bedeutungslos sind.


Das gilt mindestens ebenso für verzerrte Koeffizienten (durch omitted variable bias). Die Koeffizienten sind bei Kollinearität imerhin unverzerrt/konsitent. Ich wäre bei signifikanten Koeffizienten nicht allzu skeptisch.

Btw. bivariate Korrelationen der X Matrix sind möglicherwiese im multivariaten Regressionsmodell irrelevant. Die Methode zur Beurteilung der Kollinerität, die ich als allgemein annerkannt bezeichnen würde, wäre Varianzinfaltionsfaktoren (VIFs) zu schätzen. Die Daumenregeln hierfür sind Grenzwerte zwischen 5 und 10.

Ohne viele weitere (inhaltlichen) Informationen sind spezifische Ratschläge schwierig.