Fehlende Werte in der Zeile Konstante

Alle Verfahren der Regressionanalyse.

Fehlende Werte in der Zeile Konstante

Beitragvon tiny » Sa 2. Mär 2013, 18:32

Hallo zusammen,

ich haeb eine Frage, die ich auch nach Durchforsten der Literatur und Foren nicht lösen konnte.
Ich habe fehlende Werte (Standardfehler, Konfidenzintervall etc.) in der Zeile der Konstanten nachdem ich in Stata eine logistische Regression durchgeführt habe.
Bedeutet das, dass das Modell schlecht ist? Bei meinen anderen Modellen habe ich das Problem nicht.
Für die Profis unter euch ist diese Frage wahrscheinlich lächerlich. Wäre trotzdem dankbar für Antworten.
tiny
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 16. Okt 2012, 10:53
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Fehlende Werte in der Zeile Konstante

Beitragvon daniel » Sa 2. Mär 2013, 23:51

Klingt zumindest mal so, als wäre da irgendwo ein Problem.

WIe sehen die Fallzahlen aus? Wie komplex ist das Modell? Wie viele Iteration braucht es um zu fitten? Wie sieht die Syntax aus? Ist der output "clickbar"? Falls ja, was sagt die Hilfe?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Fehlende Werte in der Zeile Konstante

Beitragvon tiny » So 3. Mär 2013, 12:29

Hallo Daniel.
Nachdem ich die Berechnung nochmal über Nacht laufen lassen hab, kommt die Meldung: convergence not achieved r(430). Hatte zuerst eine psmatch2 laufen, dann nochmal ein logistic-Befehl.
Fallzahlen knapp 50.000. 11 unabhängige Variablen. Die Zahl der Iterationen scheint sehr groß zu sein, musste unterdrücken, kann daher keine genaue Zahl nennen. Ab der 6. Iteration steht allerdings die Bemerkung :"not concave"
Außer der Stichprobe habe ich an dem Modell nichts verändert und trotzdem so ein Ergebnis?
Was schätzst du?
tiny
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 16. Okt 2012, 10:53
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Fehlende Werte in der Zeile Konstante

Beitragvon daniel » So 3. Mär 2013, 12:56

Möglicher Weise eine sehr "schiefe" Verteilung des outcomes? Jedenfalls ist die likelihood funktion sehr flach, und ich würde den Ergebnissen nicht allzu großes Vertrauen entgegen bringen. Vielliche machst Du ein paar Senisitivitätschecks (bsp. probit Modell fitten, LPM fitten, anderen Maximierungsalgorythmus verwenden ...)

Abseits dieser Frage, wieso fittest Du überhaupt ein logitisches (oder irgendein) Regressionsmodell nach dem PSM? Nach meinem Verständnis passen die beiden Methoden von der Idee nicht ganz zusammen (statisitsch natürlich kein Problem).
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Fehlende Werte in der Zeile Konstante

Beitragvon tiny » Mo 4. Mär 2013, 10:11

Vielen Dank für deine Antworten, Daniel. Das hilft mir sehr weiter.
Ich mache hauptsächlich das PSM. logistische Regressionen mache ich nur zur Überprüfung, ob die abhängigen Variablen auch Einfluss auf die Zielvariable haben. Das PSM überprüft ja nur die Wahrscheinlichkeit der Gruppenzugehörigkeit.
tiny
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 16. Okt 2012, 10:53
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Fehlende Werte in der Zeile Konstante

Beitragvon daniel » Mo 4. Mär 2013, 11:15

tiny hat geschrieben:logistische Regressionen mache ich nur zur Überprüfung, ob die abhängigen Variablen auch Einfluss auf die Zielvariable haben.

Du meinst, ob die unabhängigen Variablen (sag einfach Prädikatoren, dann machst Du diese Tippfehler nicht, und jeder weiß klar, worum es geht) Einfluss auf die Zielvariable haben?

Das PSM überprüft ja nur die Wahrscheinlichkeit der Gruppenzugehörigkeit.


Mhh, jain. Mit PSM wird die Zugehörigkeit zur Treatmentgruppe modelliert, korrekt. Damit soll post hoc eine Randomisierung nachgestellt werden. Bei randomisierten Experimenten können wir Kontrollgruppe(n) und Treatentgruppen im Hinblick auf das outcome direkt vergleichen (z.B. mittels t-Test). Die Idee von PSM ist es demnach, danach nur Objekte zu vergleichen, die auch legitimer Weise vergleichbar sind. Das gilt vor llem im Hinblick darauf, ob wir zu jedem Treatmentfall einen Kontrollfall aus den beobachteten Daten kontruieren können.

In einer logitischen Regression nach dem matching würde man also als einzigen Prädikator den Treatment-Indikator aufnehmen. Der potentielle Einfluss aller andren Kovariaten spielt keinerlei Rolle, da diese sich ja nach (erfolgreichem!) matching nicht mehr zwischen den Gruppen unterscheiden. Wenn Du nun eine logistische Regression durchführst, in der Du neben dem Indikator für Treatment noch weitere Prädikatoren verwendest, dann widerspricht das der Idee des PSM. Das meinte ich mit

Nach meinem Verständnis passen die beiden Methoden von der Idee nicht ganz zusammen (statisitsch natürlich kein Problem).


Wenn das matching nicht erfoglreich war, es also bei einzelnen Variablen noch Unterschiede ziwchen den Gruppen zu beobachten sind, müsste man nach PSM Logik das Vorhaben abbrechen, mit der Begründung, dass man eben keinen sinnvollen Vergleich machen kann. Viele greifen dann auf Regressionen zurück, extrapolioiernde Methoden also (i.e. die Regressionen kümmert es wenig was wir tatsächlich beobachtet haben, die tut so als hätten wir alle theoretisch möglichen Werte und Kombinationen von Variablen auch tatsächlich beobachtet), bei denen man sich fragen muss, wieso die dann nicht gleich von Anfang an verwendet werden.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Fehlende Werte in der Zeile Konstante

Beitragvon tiny » Mo 4. Mär 2013, 17:49

Ja, ich meinte auch Prädiktoren. Also das Matching führe ich in dem Sinne auch durch , wie du es beschrieben hat. Das Matching gleicht die bestehenden Ungleichheiten aus auf Grundlage einiger ausgewählter beobachtbarer Prädiktoren. Es berechnet die Wahrscheinlichketien für die Zugehörigkeit zu einer der beiden Gruppen und findet einen geeigneten MAtchingpartner, um dann mittels einfacher Mittelwertunterschiede den Effekt zu bestimmen.
Mit der anschließenden logistischen Regression wollte ich nur schauen, welchen Einfluss die selben Prädiktoren auf die Outcomevariable direkt haben und nicht auf die Gruppenzugehörigkeit, denn es wird ja verlangt, dass die Prädiktoren, die in ein PSM aufgenommen werden sollen, sowohl Einfluss auf die Treatmentvariable als auch auf die Zielvariable haben. Ich habe Prädiktoren auf der MAkro- und Mikroebene (z.Bm Krankenhaus und PAtienten) ausgewählt. War mir deswegen unsicher.
Diese Regression sollte ich aus argumentationstechnischen Gründen besser vorher machen, und nicht anschließend. Das hat nichts mit dem PSM direkt zu tun.
Ich hoffe, du verstehst, was ich sagen will.

Danke dir.
tiny
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 16. Okt 2012, 10:53
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron