Seite 1 von 1

Wie umgehen mit fehlenden Variablen in Paneldaten?

BeitragVerfasst: Mi 16. Okt 2019, 16:21
von uiolo
Hallo Leute,

zurzeit arbeite ich mit Paneldaten. Diese bestehen aus insgesamt 8 Wellen und nun wollte ich auch eine logistische Panelregression machen. Meine Fragestellung dazu lautet, inwiefern das Thema Immigration während der Flüchtlingskrise an Bedeutung für das Wahlverhalten zugenommen hat.
Meine abhängige Variable ist das Wahlverhalten. Dieses habe ich zu einer binären Variable umgeformt, sodass 0=gehe bestimmt nicht wählen und 1=gehe sicher wählen ist. Meine erklärende Variable sind Einstellungen gegenüber Immigranten, von 0=Zuzugsmöglichkeiten sollten weiter eingeschränkt werden bis 5=Zuzugsmöglichkeiten sollten vereinfacht werden. Da ich eben den Effekt über die Zeit hinweg zeigen möchte, interagiere ich die erklärende Variable mit meiner Zeitvariable. Das Regressionsmodell sieht dann so aus: xtlogit wahlabsicht c.immigration c.zeit c.immigration#c.zeit. Anschließend modelliere ich die Margins und möchte diese für die 8 Wellen graphisch anzeigen, also graphisch den Effekt von Immigrationseinstellungen auf das Wahlverhalten über die Zeit hinweg zeigen.

Jetzt zum Problem: Die erklärende Variable wurde nicht in allen Wellen abgefragt, in den Wellen 3 und 4 fehlt diese Variable, weshalb ich auch den Effekt für diese Wellen nicht graphisch anzeigen kann. Daher die Fragen: Inwiefern ist dies ein Problem? Wenn diese ein Problem ist, gibt es eine Möglichkeit, diese fehlenden Variablen für die zwei Wellen doch zu modellieren, so wie es mit missing-Werten möglich ist?

Grundsätzlich einfach: Ist es ein Problem in Panelregressionen, wenn in einigen Wellen die Variablen nicht abgefragt wurden, in anderen aber schon?

Vielen Dank im VOraus