Seite 1 von 1

Regression mit Daten von verschiedenen Methoden

BeitragVerfasst: Do 25. Aug 2016, 18:52
von rotkehlpieper
Hallo alle,

ich habe eine Frage zur Regression von gepoolten Daten: Meine Daten wurden mit 3 verschiedenen Methoden erhoben, gemeinsam sind ihnen die Outcome-Variable Y und der Prediktor X. Ich bin an der Abhängigkeit von Y(X) via Regressionsanalyse interessiert.

Nun habe ich die zusätzliche Schwierigkeit, dass jede Methode spezifische Kovariate hat (A,B,...) die nur für die jeweilige Methode exisitieren und innerhalb der mit dieser Methode erhobenen Daten den Anteil unerklärter Varianz verkleinern.

Nun frage ich mich: Kann ich zu diesem Problem ein Regressionsmodell erstellen, bei denen diese "exklusiven Variablen" berücksichtigt werden? Was ich ja quasi bräuchte sind Variablen, die nur in jeweils einer der Methoden genested sind, und für die anderen Methoden nicht existieren. Ist dies möglich?

Hier anschaulich ein Beispiel-Datensatz:

Y Method X A B C
----------------------------------------------------------
3 M1 2 6 NA NA
4 M1 4 4 NA NA
4 M2 1 NA 5 NA
3 M3 4 NA NA 4
...

Ich freue mich über Vorschläge,

Danke im Voraus

Re: Regression mit Daten von verschiedenen Methoden

BeitragVerfasst: Fr 26. Aug 2016, 08:07
von bele
Denkbar wäre, die Methode zu dummycodieren und die methodenspezifischen Kovariaten jeweils nur als Interaktionsterm mit diesem Dummy ins Modell zu nehmen.

Sowas in der Art wie


Das ist nun eine an R angelehnte Notation. Du benutzt ja SPSS, da kann ich zur Umsetzung nichts sagen. Du müsstest checken, ob SPSS alle Zeilen mit NA aus dem Modell rausschmeißt. Falls ja, dann müsstest Du die NA halt durch andere (beliebige) Werte ersetzen.

LG,
Bernhard

Re: Regression mit Daten von verschiedenen Methoden

BeitragVerfasst: Fr 26. Aug 2016, 12:29
von rotkehlpieper
Hallo Bernhard,

vielen Dank schon mal. Könntest Du kurz skizzieren was die Idee hinter der Interaktionsterm-Formulierung ist, ohne dabei die entsprechenden Main-Effects zu betrachten? Was ich bisher versucht hatte war die 3 Methoden als Faktor-Variablen als Main Effects ins Modell zu nehmen, und dann für die jeweiligen "exklusiven Kovariablen" irgendwelche konsanten Werte vorzugeben dort, wo sonst NA's stehen (also für die Methoden, für die diese Variaben eigentlich nicht existieren). Da hatte ich dann aber das Problem der krassen Kollinearität zwischen Methoden und "exklusiven Kovariablen", sodass die Modelle nicht konvergiert haben. Ist das der Grund dafür, dass Du die Main Effects rauslässt?

Danke

Re: Regression mit Daten von verschiedenen Methoden

BeitragVerfasst: Fr 26. Aug 2016, 14:36
von bele
rotkehlpieper hat geschrieben: und dann für die jeweiligen "exklusiven Kovariablen" irgendwelche konsanten Werte vorzugeben dort, wo sonst NA's stehen [...]Ist das der Grund dafür, dass Du die Main Effects rauslässt?


Wenn ich "irgendwelche Werte" vorgebe, dann fließen diese "irgendwie" in das Modell ein. Das wollte ich verhindern, indem ich diese Werte immer dann, wenn sie keine Rolle spielen dürfen, mit Null multipliziere. Ob das für Dich sinnvoll erscheint, oder ob Du zusätzlich auch noch die Interaktion von Dummy, X und den "spezifischen Kovariaten" mit ins Modell nehmen willst, musst Du für Deine spezifische Aufgabe überlegen. Für eine gute Anpassung sind zusätzliche Terme immer gut, für kleine Fallzahlen oder zur Interpretation der Ergebnisse nicht unbedingt.

LG,
Bernhard

Re: Regression mit Daten von verschiedenen Methoden

BeitragVerfasst: Fr 26. Aug 2016, 14:53
von rotkehlpieper
Danke Bernhard, das war sehr hilfreich.