Umgang mit NA bei Paneldaten Regressionen

Alle Verfahren der Regressionanalyse.

Umgang mit NA bei Paneldaten Regressionen

Beitragvon NeuerNutzer1234 » Di 17. Aug 2021, 13:59

Hallo zusammen,

ich möchte eine Regressionsanalyse durchführen. Zuvor zu meinem Datensatz: Dieser besteht aus eine Reihe von Unternehmen mit Daten von 2000 bis 2020. Bevor ich die Regression durchführe, logarithmiere ich meine Daten, da dies für den Datensatz notwendig ist. Da leider einige Unternehmenswerte negativ sind, führt dies zu NA und der Datensatz hat somit keine vollständige Daten mehr. Wie ist jetzt im Rahmen der Regression mit den NA's umzugehen?
Sollte ich die Unternehmen, die unvollständige Daten haben, komplett rausschmeißen? Dies würde dazu führen, dass kaum noch Unternehmen übrig bleiben.
Sollte ich die NA's durch Mittelwerten ersetzen, die sich für jedes Unternehmen ergeben?
Sollte ich eine Transformationsfunktion beim logarithmieren einfügen ln(1+x) wenn x>0 und -ln(1-x) wenn x<0 sodass keine Daten verloren gehen
Oder sollte ich alles so lassen wie es ist und die Regression trotz fehlender einfach durchführen?

Mein Betreuer an der Uni antwortet leider nicht.. Ich würde mich über eure Tipps oder mögliche andere Vorschläge freuen.

Danke!
NeuerNutzer1234
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 17. Aug 2021, 13:51
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Umgang mit NA bei Paneldaten Regressionen

Beitragvon PonderStibbons » Di 17. Aug 2021, 14:15

Bevor ich die Regression durchführe, logarithmiere ich meine Daten, da dies für den Datensatz notwendig ist. Da leider einige Unternehmenswerte negativ sind,

Wenn negative Werte vorkommen, dann ist es ziemlich überraschend, dass es notwendig sein soll.
Woher stammt das mit der Notwendigkeit?
führt dies zu NA und der Datensatz hat somit keine vollständige Daten mehr. Wie ist jetzt im Rahmen der Regression mit den NA's umzugehen?

Das ist eigentlich nicht zu beurteilen, weil Fragestellung und Art der Daten und der Grund für das Logarithmieren
unbekannt sind. Womöglich kannst Du den niedrigsten Wert jeweils als Nullpunkt setzen und danach transformieren,
aber das ist nur geraten.
Mein Betreuer an der Uni antwortet leider nicht..

Seit wie vielen Wochen? Immerhin ist es Urlaubszeit.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11251
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2469 mal in 2453 Posts

Re: Umgang mit NA bei Paneldaten Regressionen

Beitragvon NeuerNutzer1234 » Di 17. Aug 2021, 14:38

PonderStibbons hat geschrieben:
Bevor ich die Regression durchführe, logarithmiere ich meine Daten, da dies für den Datensatz notwendig ist. Da leider einige Unternehmenswerte negativ sind,

Wenn negative Werte vorkommen, dann ist es ziemlich überraschend, dass es notwendig sein soll.
Woher stammt das mit der Notwendigkeit?
führt dies zu NA und der Datensatz hat somit keine vollständige Daten mehr. Wie ist jetzt im Rahmen der Regression mit den NA's umzugehen?

Das ist eigentlich nicht zu beurteilen, weil Fragestellung und Art der Daten und der Grund für das Logarithmieren
unbekannt sind. Womöglich kannst Du den niedrigsten Wert jeweils als Nullpunkt setzen und danach transformieren,
aber das ist nur geraten.
Mein Betreuer an der Uni antwortet leider nicht..

Seit wie vielen Wochen? Immerhin ist es Urlaubszeit.

Mit freundlichen Grüßen

PonderStibbons


Mein Regressionsansatz basiert quasi auf ein Modell, dass ich für einen aktuellen Datensatz reproduzieren soll und in diesem Modell werden die Variablen logarithmiert. Wieso weshalb warum das gemacht wird (abgesehen vom Argument Datenglättung) ist leider nicht begründet.

Der Betreuer ist seit ein paar Tagen vom Urlaub zurück, also auch total normal das noch keine Antwort gekommen ist.
NeuerNutzer1234
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 17. Aug 2021, 13:51
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Umgang mit NA bei Paneldaten Regressionen

Beitragvon PonderStibbons » Di 17. Aug 2021, 14:43

Dann müsste man so verfahren wie bei dem Ausgangsmodell, würde ich zunächst einmal annehmen.
Gibt es zu dem Modell keine Referenzliteratur?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11251
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2469 mal in 2453 Posts

Re: Umgang mit NA bei Paneldaten Regressionen

Beitragvon NeuerNutzer1234 » Di 17. Aug 2021, 14:51

PonderStibbons hat geschrieben:Dann müsste man so verfahren wie bei dem Ausgangsmodell, würde ich zunächst einmal annehmen.
Gibt es zu dem Modell keine Referenzliteratur?

Mit freundlichen Grüßen

PonderStibbons


Es gibt ein Paper, dass das Modell ebenfalls reproduziert hat. Die Variablen dort wurden ebenfalls logarithmiert, leider auch ohne weitere Begründung. Es ist auch nicht erläutert, was mit ursprünglich negativen Variablen passiert. Daher gehe ich davon aus, dass die Regressionen ganz normal mit unvollständigen Daten durchgeführt wurden. Würde sich denn sowas eigentlich "negativ" auf das Regressionsergebnis auswirken oder wäre das vollkommen irrelevant.
NeuerNutzer1234
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 17. Aug 2021, 13:51
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron