Benötige Hilfe liebe Community! Lineare OLS Reg./Kontrollvar

Alle Verfahren der Regressionanalyse.

Benötige Hilfe liebe Community! Lineare OLS Reg./Kontrollvar

Beitragvon JonasHonnef » Sa 13. Sep 2014, 15:52

Hallo zusammen,

erst einmal bin ich sehr gespannt auf das Forum und schon einmal sehr dankbar für dessen Existenz!

Ich schreibe derzeit meine Masterarbeit und nach 50 englischen Seiten theoretischer und methodischer Abhandlungen komm ich nun zur Auswertung meiner Regressionanalyse. Ich bin weder Experte, noch völlig unbewandert im Bereich der empirischen Datenanalyse, d.h., mir ist vieles, aber lange nicht alle theoretisch verständlich, dennoch ist dies mein erste eigene Datenanalyse, die nicht auf iwelchen fertigen Beispieldatensätzen beruht. D.h. alle Daten wurden selber erhoben, aufbereitet, Z-standardisiert, ggf. logarythmiert etc...

Jetzt stoße ich auf folgendes Problem für dessen Lösung ich sehr dankbar wäre!

Hintergrund meiner Arbeit: Ich zeige theoretisch und empirisch auf, dass die Qualität der Nachhaltigkeitsberichterstattung (metrische scorings) der DAX30 Unternehmen (2003-2011, 87 Fälle) positiv beeinflusst wird a) von der Existenz externer Prüfvermerke (assurance statements, dummy-variabel) und b) der Nachhaltigkeitsperformance dieser Unternehmen (metriches scorings). Das klappt auch sehr gut sowohl in der bivariaten, als auch in der multivariaten Analyse.

Problem: Probleme habe ich lediglich bei einer meiner Kontrollvariablen. Dabei kontrolliere ich die Branchenzughörigkeit der Unternehmen. Hierfür habe ich 6 dummy variablen gebildet und alle unternehmen (Fälle) eine dieser dummy variablen zugeordnet. Die 6. dummy variable heißt "others". Hierunter wurden 5 Unternehmen zusammengefasst, die keiner der anderen Branchen zuzuordnen sind.

Das Problem ist nun, dass alle Koeffizienten dieser dummy variablen ein negatives Vorzeichen haben, was neben theoretische Überlegen, auch mathematisch nicht möglich sein kann, denn dies würde ja bedeuten, dass jede einzelne Branche unterhalb des Mittelwertes aller Branchen liegt.

Zudem wird eine der Sektordummys aus der Regression ausgeschlossen. Das verstehe ich zum jetztigen Standpunkt auch noch nicht.

Habe den SPSS Output im Anhang zur Verfügung gestellt. Es geht um die Variable: "finance,insurance", "utilities", "industrials", "basic materials" "others" und "Consumer goods".

Über jedwede Hilfe ich bin ich sehr dankbar!!!

Besten Gruß
Dateianhänge
Screenshot 2014-09-13 15.36.48.png
SPSS Output
Screenshot 2014-09-13 15.36.48.png (79.46 KiB) 999-mal betrachtet
JonasHonnef
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Sa 13. Sep 2014, 15:21
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Benötige Hilfe liebe Community!

Beitragvon PonderStibbons » Sa 13. Sep 2014, 16:10

Das Problem ist nun, dass alle Koeffizienten dieser dummy variablen ein negatives Vorzeichen haben, was neben theoretische Überlegen, auch mathematisch nicht möglich sein kann, denn dies würde ja bedeuten, dass jede einzelne Branche unterhalb des Mittelwertes aller Branchen liegt.

Zudem wird eine der Sektordummys aus der Regression ausgeschlossen. Das verstehe ich zum jetztigen Standpunkt auch noch nicht.

Vielleicht sollte SPSS wieder damit aufhören, automatisch einen dummy
rauszuwerfen, und stattdessen eine Fehlermeldung ausgeben.

Eine kategoriale Variable mit k Kategorien wird durch k-1 dummy-
Variablen repräsentiert. Die nicht durch eine eigene Variable
repräsentierte Kategorie ist die "Referenzkategorie". Dass die
übrigen im Vergleich ein Minuszeichen aufweisen, ist also ohne
weiteres möglich.

Wieso nur nur 45 statt 87 Fälle analysiert wurden wundert mich
allerdings. 12 Prädiktoren sind selbst bei 87 Fällen schon fast zu
viel.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11258
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2473 mal in 2457 Posts

Re: Benötige Hilfe liebe Community! Lineare OLS Reg./Kontrol

Beitragvon JonasHonnef » Sa 13. Sep 2014, 17:09

Hallo P.,

herzlichen Dank schonmal! Ja, dass habe ich im Prinzip auch so gelesen habe, nur umgesetzt, weil ich dachte gesehen zu haben, dass es in Referenzstudien auch anders gemacht wurde. Aber gut. Wenn ich aber die Annahme treffe, Branchen x und y haben einen Einfluss auf mein Kriterium, währende alle anderen Branchen (jedes Unternehmen ist ja logicherweise einer Branche zugehörig) als Referenzkategorie gelten, dann muss ich doch trotzdem so eine Variable erstellen und SPSS irgendwie erklären, dass dies meine Referenzkategorie ist!?! Oder einfach für beeinflussenden Kateogiren 0/1 kodieren und für alle Unternehmen (Fälle) die nicht in diesen Branchen sind 0 kodieren und SPSS "denkt" sich die als Referenzvariable/-katogorie?

Bzgl der Fallzahl, ohne dich zu sehr in Anspruch nehmen zu wollen, das hat mich auch schon schlechtgestimmt. Das hängt mit fehlenden Werten zusammen, die sich in meinem UV ergeben. Bisher habe ich mit der Aufforderung "excluded cases listewise" gearbeitet. Kannst du mir begründet eine andere Methode empfehlen, also paarweisen Ausschluss resp. durch Mittelwert ersetzen? Bin mir da unsicher.

Aber: Wenn ich das mit der Referenzkategorie hinbekommen habe und z.B. nur eine oder zwei Dummys erstelle, die Branchen repräsentieren, bei denen ich einen Einfluss vermute (sind ja nicht alle logischerweise :D), dann reduziert sich meine Prädiktoranzahl ja auf 8 Prädiktoren. Hab da bisher immer mit der Regel 1/3 x Fallzahl - 1 (Konstante) als Fausregel gearbeitet, womit ich bei 45 Fällen nicht mehr als 14 Prädiktoren verwenden wollte. Letztlich führe ich Anschluss ja auch eine "stepwise backward" aus, um, so die Argumentation, das theoretich hergeleitete Modell und in einem zweiten Schritt effizienter zu machen und unnötige Bias-Ursachen auszuschließen (siehe Anhang).

Also, besten Dank nochmal schon mal! :D
JonasHonnef
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Sa 13. Sep 2014, 15:21
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Benötige Hilfe liebe Community! Lineare OLS Reg./Kontrol

Beitragvon JonasHonnef » Sa 13. Sep 2014, 17:11

Siehe Anhang
Dateianhänge
Screenshot 2014-09-13 17.09.56.png
Screenshot 2014-09-13 17.09.56.png (87.61 KiB) 991-mal betrachtet
JonasHonnef
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Sa 13. Sep 2014, 15:21
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Benötige Hilfe liebe Community! Lineare OLS Reg./Kontrol

Beitragvon PonderStibbons » Sa 13. Sep 2014, 17:47

Zu den dummy-Überlegungen kann ich nichts sagen, das
sind inhaltliche Fragen.
Bzgl der Fallzahl, ohne dich zu sehr in Anspruch nehmen zu wollen, das hat mich auch schon schlechtgestimmt. Das hängt mit fehlenden Werten zusammen, die sich in meinem UV ergeben. Bisher habe ich mit der Aufforderung "excluded cases listewise" gearbeitet. Kannst du mir begründet eine andere Methode empfehlen, also paarweisen Ausschluss resp. durch Mittelwert ersetzen?

Mittelwertersetzung ist keine brauchbare Methode.
Missing data analysis und -Ersetzung ist ein Thema für sich.
Bei fast 50% Datenausfall allerdings ein dringliches in Deinem
Fall. Vielleicht geht -> multiple imputation. Schlimmstenfalls
-> hot deck Methoden, falls der Betreuer es abnickt.
Hab da bisher immer mit der Regel 1/3 x Fallzahl - 1 (Konstante) als Fausregel gearbeitet

Wo kommt das denn hier? Die Faustregel mit dem minimalsten
Ansatz, die mir bisher untergekommen ist, verlangte n=8 pro
Prädiktor.
Letztlich führe ich Anschluss ja auch eine "stepwise backward" aus, um, so die Argumentation, das theoretich hergeleitete Modell und in einem zweiten Schritt effizienter zu machen und unnötige Bias-Ursachen auszuschließen

stepwise Methoden sind eine Pest und in aller Regel
tunlichst zu vermeiden. In einem Fall, wo sowieso schon overfitting
(d.h. eine erhebliche Gefahr nicht reproduzierbarer und nicht
generalisierbarer Ergebnisse) vorliegt, ist das der GAU. Dass
das bias reduzieren könnte habe ich noch nie gehört, sondern
genau das Gegenteil.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11258
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2473 mal in 2457 Posts

folgende User möchten sich bei PonderStibbons bedanken:
JonasHonnef

Re: Benötige Hilfe liebe Community! Lineare OLS Reg./Kontrol

Beitragvon JonasHonnef » Sa 13. Sep 2014, 18:42

Danke für die Rückmeldung. Hot deck Methode und Multiple Imputation sagt mir grad nichts, schlage ich aber mal nach. Mein Betreuer arbeitet ausschließlich mit qualitativen Methoden, weswegen er den von ihm erstellen Datensatz auch an mich abgedrückt hat, denke ich ;) Insofern, ist es auch denke ich auch okay, wenn der Datensatz einfach nicht mehr hergibt. Es ist auch tatsächlich so, dass ich von Anfang an erkläre den Anspruch auf Inferenzstatistik und damit der Generalsierbarkeit meiner Aussagen abzulegen. Aussagen sollen lediglich für mein Sample gültig sein, was auch mit der Fallauswahl zu tun hat.

Um dein Interesse bzgl. der Faustregel zu stillen. Die stammt von Herrn Prof. Jahn, nachzulesen in Jahn, D. (2006). Einführung in die Vergleichende Politikwissenschaft (habe im B.A. mal Politikwissenschaft nebenbei studiert).

Ok, dass mit der stepweis werd ich mir zu herzen nehmen. Ich bin wie gesagt auch der Meinung Modelle sollten theoretisch hergeleitet sein und nicht andersherum. Die Idee Variablen zu entfernen die adjusted R2 erhöhen fand ich aber ansich nicht abwegig. Aber, das sehe ich ein, bei meinem Wissensstand bewäge ich mir das sicher auf glattem Eis ^^
JonasHonnef
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Sa 13. Sep 2014, 15:21
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Benötige Hilfe liebe Community! Lineare OLS Reg./Kontrol

Beitragvon JonasHonnef » Sa 13. Sep 2014, 18:44

Sorry, für meine ganzen Verschreiber, aber in 14 Tagen ist Abgabe und na ja.. ihr kenn das ggf. ja ;)
JonasHonnef
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Sa 13. Sep 2014, 15:21
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron