STATISTIK-FORUM.de

Stitch · von **Stitch** » Mi 5. Jun 2013, 14:39

Hallo!

wie es das Thema schon vermuten lässt, versuche ich, eine Cox-Regression in SPSS durchzuführen. Mein Anliegen ist es, den Einfluss verschiedener Immunzelltypen im Tumor mit diversen Covariaten wie Alter, Geschlecht und Krankheitsstadium auf das Überleben zu untersuchen.
Mein Problem ist, dass die Anzahl der Zellen stark voneinander abhängig sind, da es teils Untergruppen voneinander sind und auch die Verhältnisse berücksichtigt werden. Ich kann mich dunkel erinnern, dass das in solchen Analysen ein Problem ist. Meine Beobachtung ist auch, dass der Einfluss bei Einschluss jeweils nur eines der Zelltypen schön signifikant ist, wenn ich alle gleichzeitig mit reinnehme, aber verschwindet. Gibt es eine elegante Möglichkeit, dass zu umgehen? Mein naiver Ansatz war, die Analysen getrennt zu machen, allerdings ändern sich dadurch auch die Exp(B) und p-Werte der anderen Covariaten und ich weiß nicht, welche die "echten" Werte sind (am Ende soll alles in eine Tabelle).

Danke schonmal für die Hilfe und viele Grüße

S.

daniel · von **daniel** » Mi 5. Jun 2013, 17:16

Deine Frage betrifft die unabhängigen Variablen (besser: Prädikatoren), oder?

Mein Problem ist, dass die Anzahl der Zellen stark voneinander abhängig sind, da es teils Untergruppen voneinander sind und auch die Verhältnisse berücksichtigt werden.

Auch wenn ich thematisch nahezu nicht verstehe, was hier gemacht wird, scheint mir die Kollinearität, die hier angesprochen wird absehbar zu sein. Ob das ein "Problem" ist, hängt davon ab, was genau man unter einem Problem versteht. Am Rande: wenn es hier um Verhältnisse geht müssen immer die (konditionalen) Haupteffekte berücksichtigt werden (das wird häufig übersehen).

Meine Beobachtung ist auch, dass der Einfluss bei Einschluss jeweils nur eines der Zelltypen schön signifikant ist, wenn ich alle gleichzeitig mit reinnehme, aber verschwindet.

Die Koeffizienten bei Einschluss aller Zelltypen spiegeln den Einfluss/Effekt der jeweiligen Zelltypen unter Konstanthaltung aller weiteren Typen wider. Wenn Du an diesen Effekten interessiert bist (das bist Du typischer Weise) bleibt Dir leider nicht viel übrig, als die hohen Standradfehler (i.e. fehlende Signifikanzen) in Kauf zu nehmen, die akkurat die Unsicherheit in der schätzung der Koeffizienten widerspiegeln. Du kannst versuchen (wie und ob auch immer das technisch in SPSS machbar ist) die Koeffizienten aller Zelltypen auf gemeinsame Signifikanz testen (F-Test).

Mein naiver Ansatz war, die Analysen getrennt zu machen

Damit ignorierst Du die Zusammenhänge der Prädikatoren und das ist wahrscheinlich nicht das, was Du möchtest.

Stitch · von **Stitch** » Mi 5. Jun 2013, 18:07

Vielen Dank für die Anmerkungen!
Mit den Terminologien bin ich leider nicht so firm. Die Variablen sind für das Modell unabhängig, aber einige (nämlich meine gemessenen Zellen, deren Einfluss ich mir in univariaten Analysen schon angeguckt habe) hängen alle auf die eine oder andere Art miteinander zusammen.

Ich denke, ich werde es so machen, wie du beschrieben hast. Dem p-Wert wird eh viel zu viel Bedeutung zugesprochen

Kann man ja alles in der Diskussion abfrühstücken.
Vielleicht noch ein paar Konkrete fragen zum Verständnis. Mit der Cox-Regression hab ich nämlich noch so meine Probleme:
Ich habe mit Blöcken gearbeitet. Der erste Block beeinhaltete die klinischen Variablen (Alter, etc.), der zweite den ersten Zelltyp (von Hauptinteresse), der dritte noch zwei andere. Nach Einschluss des ersten Blocks wurden die Variablen aus Block 2+3, die noch nicht in der Kalkulation berücksichtigt, mit ihrer Signifikanz angezeigt:

Variablen nicht in der Gleichung
Score df Signifikanz
Zelltyp A 4.078 1 0.043
Zelltyp B 2.336 1 0.126
Verhältnis A/B .084 1 0.772

Zelltyp A ist hat hier also signifikanten Einfluss, ist ja schonmal prima. Wenn nur der mit eingeschlossen wird, bleibt dessen Signifikanz auch erhalten. Wenn jetzt auch noch der dritte Block eingeschlossen wird, fallen alle p-Werte der Zelltypen auf einen p-Wert von ~0.5, alle anderen Variaten bleiben fast gleich. Meine Frage ist jetzt eigentlich nur, wie sich das erklären ließe, dass ein Faktor durch einen anderen "unwichtig" gemacht wird, der sich aber als genauso nichtsaussagend herausstellt.

daniel · von **daniel** » Do 6. Jun 2013, 00:23

Vielleicht finde ich gegen Wochenende nochmal mehr Zeit, hier vorab nur (vermutlich nicht allzu hilfreiche) Warnungen.

Ich habe mit Blöcken gearbeitet.

Warum? Wenn es um den Vergleich von Koeffizienten zwischen den Modellen geht, dann ist dieses Vorgehen nicht ohne weiteres in nicht-linearen Modellen (u.a. Cox Regressionen) korrekt umsezbar (vgl. regressionanalyse-f11/logistische-regression-uber-kindersterblichkeit-mit-stata-t1103-10.html).

Zelltyp A 4.078 1 0.043
Zelltyp B 2.336 1 0.126
Verhältnis A/B .084 1 0.772

Das ist korrekt umgesetzt, aber möglicherweise nicht korrekt interpretiert. Da A/B auch als (A* 1/B) geschrieben werden kann, handelt es sich hier um einen Interaktionseffekt. Dieser ist statistisch nicht signifikant und kann daher möglicherweise aus dem Modell ausgeschlossne werden. Wird er das nicht, dann ist der Koeffizient für B nicht der Effekt von B, sondern der Effekt von B an der Stelle A = 0. Demnach ist es auch inkorrekt zu schlussfolgern, B habe keinen signifikanten Effekt, denn diese Aussage ist nur an einer Stelle (A = 0) belegt. Ähnliches gilt, wenn auch etwas konmplexer (weil B im Nenner auftaucht) für die Interpretation des Koeffizienten für A (vgl.regressionanalyse-f11/interpretation-interaktion-moderierte-regression-t2455.html).

STATISTIK-FORUM.de

Abhängige Variablen in Cox-Regression

Abhängige Variablen in Cox-Regression

Re: Abhängige Variablen in Cox-Regression

Re: Abhängige Variablen in Cox-Regression

Re: Abhängige Variablen in Cox-Regression

Wer ist online?