Dummies in lin. Reg. mit B interpretieren?

Alle Verfahren der Regressionanalyse.

Dummies in lin. Reg. mit B interpretieren?

Beitragvon Marie1 » Mo 6. Aug 2012, 22:05

Hallo,

ich habe eine multiple lin. Regression gerechnet, in der auch Dummies enthalten sind.
Da diese nicht um eine Standardabweichung ihrer selbst ändern können, ist eine Interpretation
anhand des standardisierten Regressionskoeffizienten (Beta) nich sinnvoll.
Nun habe ich gelesen, dass man den unstandardisierten Reg.koeffizienten
heranziehen und diese Koeffizienten miteinander vergleichen kann, wenn die AV
die gleiche Skala aufweisen. Bei Den Dummies wäre das ja der Fall, da sie alle 0/1 kodiert sind.
Interpretiert man Dumies nun anhand des unstandardisierten Koeffizienten, oder muss ich da noch was beachten?
Ich habe eine Variable in 2 Dummies (k-1) transformiert und die eine weist einen deutlich höheren B Wert auf als die andere.
Könnte ich diesen Unterschied nun auch auf die stärkere Einflussstärke beziehen?

Gruß
MArie
Marie1
Mitglied
Mitglied
 
Beiträge: 29
Registriert: Mi 4. Jul 2012, 09:43
Danke gegeben: 11
Danke bekommen: 0 mal in 0 Post

Re: Dummies in lin. Reg. mit B interpretieren?

Beitragvon Holgonaut » Di 7. Aug 2012, 09:23

Hi Marie,

das B der dummies ist einfach der AV-Mittelwertsunterschied zwischen 0 und 1.

Gruß
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Dummies in lin. Reg. mit B interpretieren?

Beitragvon daniel » Di 7. Aug 2012, 10:14

Aus purem Interesse: Welche substantiell theoretische Fragestellung, fragt denn nach dem stärksten Effekt einer Reihe von Prädikatoren? Und wie genau ist die Stärke eines Effekts in diesem Fall definiert?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Dummies in lin. Reg. mit B interpretieren?

Beitragvon Marie1 » Di 7. Aug 2012, 10:47

Hi Holger,

gilt das auch für eine nicht-standardisierte AV?
habe beim Urban 2008 gelesen, dass man für die Interpretation der Dummies anhand des B die AV standardisieren muss.
Wenn B aber einfach die Veränderung des Mittelwertes der AV ist, wenn man von 0 auf 1 wechselt, dann kann man das ja auch sehr
gut interpretieren.

Gruß
MArie
Marie1
Mitglied
Mitglied
 
Beiträge: 29
Registriert: Mi 4. Jul 2012, 09:43
Danke gegeben: 11
Danke bekommen: 0 mal in 0 Post

Re: Dummies in lin. Reg. mit B interpretieren?

Beitragvon Marie1 » Di 7. Aug 2012, 10:59

Hi Daniel,

wenn man z.b. verschiedene Prädiktorengruppen (familienbezogene, soziodemografische, Bildung, Arbeitsmarktsituation etc.) in ein Modell mit einbezieht, könnte sich ja evtl. zeigen, dass eine bestimmte Gruppe höhere Beta-Werte aufweist als eine andere Gruppe. Man könnte z.b. fragen, ob die Arbeitsmarktsituation ein wichtigerer Faktor zur VOrhersage in die Berufstätigkeit ist, als die eigentliche Ausbildung. Anahnd der Beat-Werte lässt sich doch die Wichtigkeit oder Einflussstärke (je höher Beta desto wichtiger x) interpretieren oder lieg ich da gänzlich falsch?

Gruß
MArie
Marie1
Mitglied
Mitglied
 
Beiträge: 29
Registriert: Mi 4. Jul 2012, 09:43
Danke gegeben: 11
Danke bekommen: 0 mal in 0 Post

Re: Dummies in lin. Reg. mit B interpretieren?

Beitragvon daniel » Di 7. Aug 2012, 12:07

Das lernt man in Einführungskursen für Statisitk. Das Problem ist m.E., dass wir in den Human-, Sozial- und Wirtschaftswissenschaften keine Statistik brauchen, sondern Ökonometrie. Damit meine ich, dass wir statistische Methoden nicht im luftleeren Raum anwenden.

Was soll es denn inhaltllich bedeuten, wenn die Arbeitsmarksituation "wichtiger" ist, als die eigenen Bildung? Da Individuen i.d.R. nur letztres beeinflussen können, dagegen keinen direkten Einfluss auf die Arbeitsmarktsituation haben, spielt es aus individueller Perspektive keinerlei Rolle, ob und wie "wichtig" die Arbeitsmarktsituation ist. Aus politischer Sicht dagegen, ist es möglicher Weise einfacher die Arbeitsmarktsituation zu beeinflussen, als das Bildungsverhalten der Individuen.

Man kann eben m.E. nicht sinnvoll pauschale Aussagen der Art: x ist für y "wichtiger" als z treffen.

Das eine solche Interpretation standardisierter Koeffizienten ohnehin fragwürdig ist, siehst Du daran, dass die Standardabweichungen der einzelenen Variablen einen Einfluss auf den "Effekt" haben.
Nimm der Datengenerierende Prozess sei

y = 2*x + 2*z + e

wobei x und z beides normalverteilte quantitative Variablen sind, e ein normalverteilter Zufallsfehler ist. Wie Du siehst haben x und z den gleichen Effekt (nämlich 2). Bei einer Regressionsschätzung würden wir auch b-Werte von 2 für beide Variablen schätzen. Wenn nun die Standradabweichung von x doppelt so groß ist, wie die von z, dann ist beta von x, doppelt so groß, wie beta von z. Demnach wäre x dann "wichtiger" als z, obwohl der Effekt der beiden Variablen genau gleich ist.

(Wenn gewünscht, kann ich geren einen Stata code zur Simulation posten).
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Dummies in lin. Reg. mit B interpretieren?

Beitragvon Marie1 » Do 9. Aug 2012, 16:28

Hi Daniel,

danke für die ausführliche und verständliche Ausführung zur Problematik der Interpretation von Regressionskoeffizienten und das Simulationsangebot.
Auf die verschiedensten Probleme bin ich beim Urban schon gestoßen. Dieser Varianzabhängigkeit könnte man aber mit einer Standardisierung der UVs entgegenkommen, oder? JEdenfalls reflektiere ich auf jeden Fall die Problematik.

Gruß
MArie
Marie1
Mitglied
Mitglied
 
Beiträge: 29
Registriert: Mi 4. Jul 2012, 09:43
Danke gegeben: 11
Danke bekommen: 0 mal in 0 Post

Re: Dummies in lin. Reg. mit B interpretieren?

Beitragvon daniel » Do 9. Aug 2012, 17:49

Naja, aber beta Koeffizienten basieren doch auf standardisierten Variablen. Das Problem ist, das b den "kausalen" Effekt schätzt, während beta den "kausalen" Effekt mit der Verteilung der Variablen in der Stichprobe mischt. Das ist nicht per se problematisch, aber m.E. für die meisten Fragestellungen irrelevant, bzw. irreführend.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 5 Gäste