STATISTIK-FORUM.de

Jokomat · von **Jokomat** » Mi 15. Mai 2013, 16:22

Hallo!
Ich arbeite gerade an meiner MA und hänge jetzt in der Interpretation der logistischen Regression fest und leider ist in meinem Umfeld keiner statistisch auch nur irgendwie bewandert.
Ich habe ein Studie über Tumoren mit einer Größe von N =39, wobei meine Stichprobe in 2 Gruppen eingeteilt ist, nämlich einmal Gruppe 1 (n= 24) mit keiner Metastasierung im Verlauf, und Gruppe 2 Metastasierung im Verlauf (n=15).
Hierbei habe ich 3 metrische Variablen x,y,z gemessen und jeweils mittels student’s t-test für unabhängige Variablen festgestellt, dass sich die Gruppen 1 und 2 sich in diesen Variablen signifikant unterscheiden und die einzelnen Variablen x,y,z jeweils größer sind in der Gruppe mit metastasierten Tumoren (also Gruppe 2).

Jetzt möchte ich wissen, ob ich anhand der drei Variablen x,y,z das Outcome Metastasierung tritt ein bzw. tritt nicht ein vorhersagen kann. Hierbei interessiert mich, ob eben alle Variablen zusammen, einzeln oder die Kombination 2er das Outcome vorhersagen können bzw. mit welcher Wahrscheinlichkeit sie das richtige outcome vorhersagen können.
Meine Idee ist, das je größer die Variablen x,y,z sind, desto wahrscheinlicher tritt eine Metastasierung der Tumore ein.

Da ich ja ein binäres outcome habe (metastase ja/nein) nehme ich die logistische Regressionsanalyse.

Wenn ich alle 3 Variablen x,y,z gleichzeitig in das Modell mit einschließe, wird in 76,9% der Fälle das richtige Outcome vorhergesagt, im Vergleich zu 61,5% wenn keiner der Variablen im Modell (Basicmodel) mit aufgenommen wird. Im Omnibustest sind für alle Variblen p< 0,05, d.h. sie liefern einen signifikanten Zuwachs zur Modellanpassung.
Nagelkerkes R-Quadrat ist 0,302, d.h. Die Fehlerreduktion durch einfügen der Prädiktoren in das Modell beträgt 30,2 %.

Jetzt zeigt mir SPSS diese Tabelle an:

Variablen in der Gleichung
RegressionskoeffizientB Standardfehler Wald df
Schritt 1a x ,246 ,184 1,783 1
y 2,477 2,847 ,757 1
z 1,549 1,767 ,769 1
Konstante -10,294 5,594 3,387 1

Variablen in der Gleichung
Sig. Exp(B)
Schritt 1a x ,182 1,279
y ,384 11,906
z ,381 4,707
Konstante ,066 ,000

Da der Wald- Test bei allen Prädiktoren > 0,05 ist, habe ich daraus geschlossen, dass sich kein signifikanter Einfluss der Prädiktoren auf das Outcome nachweisen lässt. Wie ich Exp(B) bzw. die OddsRatio zu interpretieren habe, weiß ich ehrlich gesagt nicht richtig.

Wenn ich nur die Variable x in das Modell mit einschließe oder auch die Variable x*y, dann ist im Wald-Test p< 0,05, d.h. kann die Variable x bzw. die Kombination von x*y das Outcome vorhersagen?
Variablen in der Gleichung
RegressionskoeffizientB Standardfehler Wald df
Schritt 1a y by x ,271 ,114 5,675 1
Konstante -2,100 ,767 7,502 1

Variablen in der Gleichung
Sig. Exp(B)
Schritt 1a y by x ,017 1,311
Konstante ,006 ,122

Also, worauf es eigentlich hinaus läuft, ist, dass ich nicht verstehe und ausdrücken kann, was man OddsRatio bei metrischen unabhängigen Variablen und eben die binäre abhängige Variable mir sagt und ob ich überhaupt den Rest zuvor richtig interpretiert habe.

Eigentliches großes Ziel dieser Studie soll sein, den Vorschlag zu bringen, meine Variablen x,y,z in der Zukunft bei den von mir untersuchten TUmorenart zu erheben, da sie dazu beitragen, eine Metastasierung zu erkennen.
Natürlich weiß ich, dass ich mit meiner kleinen Stichprobe nur sehr vorsichtig behaupten kann, dass sie das Outcome vorhersagen bzw. die Vorhersage des Outcomes verbessern.

daniel · von **daniel** » Mi 15. Mai 2013, 17:18

Deine "Tabelle" kann ich in dieser Formatierung sehr schlecht (gar nicht) lesen.

Nagelkerkes R-Quadrat ist 0,302, d.h. Die Fehlerreduktion durch einfügen der Prädiktoren in das Modell beträgt 30,2 %.
[...]
Da der Wald- Test bei allen Prädiktoren > 0,05 ist, habe ich daraus geschlossen, dass sich kein signifikanter Einfluss der Prädiktoren auf das Outcome nachweisen lässt.

Wie hoch sind denn die Prädikatoren untereinander korreliert? Die relativ gute Modellpassung bei hohen Standardfehlern deutet in Richtung Multikolli-Probleme. Inhaltlich kann ich dazzu nichts sagen, weil ich (a) nicht vom Fach bin, und (b) selbst wenn ich es wäre, die Benennung der Faktoren als x, y, z nichtssagend ist.

Wenn ich nur die Variable x in das Modell mit einschließe oder auch die Variable x*y

Vorsicht. Was soll mit dem Produkterm getestet werden? Wenn Du eine Wechselwirkung der beiden Prädikatoren testen willst, musst Du zwingend auch die Einzelbestandteile der Interaktion (muliplikativen Verknüpfung), also x und y aufnehmen.

Wie ich Exp(B) bzw. die OddsRatio zu interpretieren habe, weiß ich ehrlich gesagt nicht richtig.

Relativ einfach. Das ist der multiplikative Effekt auf die Chancen Metastasen zu entwickeln, wenn der Prädikator um eine Einheit steigt.

STATISTIK-FORUM.de

Logistische Regressionsanalyse- Interpretation OddsRatio

Logistische Regressionsanalyse- Interpretation OddsRatio

Re: Logistische Regressionsanalyse- Interpretation OddsRatio

Wer ist online?