Seite 1 von 2

Ausgeschlossene Dummy-Variable bei der linearen Regression

BeitragVerfasst: Sa 9. Nov 2019, 20:57
von TiWas
Hallo zusammen,
ich habe eine lineare Regression (1 intervallskalierte AV aus einem psychologischen Test), mehrere intervallskallierte UVs (z.B. Alter) sowie eine Dummy-codierte UV (4 verschiedene Studienrichtungen) mit 3 Dummy-Variablen und einer Referenzkategorie vor.
Diese Regression führe ich für verschiedene Gruppen (Stichprobe mindestens 80) und mit verschiedenen unabhängigen AVs durch. Die Ergebnisse zeigen meistens keinen signifikanten Einfluss bei den 3 Dummy-Variablen. Einmal habe ich jedoch den Fall, dass zwei der Dummy-Variablen gerechnet werden und ich für die 3. die Meldung bekomme, dass diese ausgeschlossen ist. Ich habe als Methode jedoch erstmal "Einschluss" gewählt, sodass alle Variablen eingerechnet werden sollten. Woran kann das liegen? Wie kann ich diese 3. Dummy-Variablen, die ausgeschlossen wurde, in meiner Arbeit angeben? Die Werte (Regressionskoeffizient, Standardfehler, P-Wert etc.) fehlen ja. Wie kann ich das begründen, warum das Fehlen o.k. ist, wenn es das ist? Danke für eure Hilfe!

Re: Ausgeschlossene Dummy-Variable bei der linearen Regressi

BeitragVerfasst: Sa 9. Nov 2019, 23:52
von PonderStibbons
Variablen werden ausgeschlossen, wenn sie redundant sind (aus der Kombination anderer Variablen hervorgehen würden).
Wie lautet denn der genaue Wortlaut?

Mit freundlichen Grüßen

PonderStibbons

Re: Ausgeschlossene Dummy-Variable bei der linearen Regressi

BeitragVerfasst: So 10. Nov 2019, 00:18
von TiWas
Wenn die Variable redundant wäre, wie könnte ich erfahren, aus welcher Kombination anderer Variablen sie hervorgehen könnte?

In der Ausgabe steht nach der Tabelle mit dem Koeffizienten eine neue Tabelle mit der Überschrift "Ausgeschlossene Variablen". Dort ist dann eine der Dummy-Variablen bzw. einer der 4 verschiedenen Studiengänge aufgeführt.

Bei einer Regression mit einer anderen Stichprobe (eine andere Auswahl an Studierenden) erscheinen bei dieser Dummy-Variable jedoch Ergebnisse. Somit sieht es für mich so aus, als wäre das kein grundsätzliches Problem dieser Dummy-Variable, sondern hätte eher etwas mit dem Ergebnis (fehlende Vorhersagekraft?) dieser Dummy-Variable zu tun. Hier stellt sich für mich aber die Frage, warum diese dann nicht einfach als nicht signifikant in der Tabelle mit den Koeffizienten aufgeführt ist?

Re: Ausgeschlossene Dummy-Variable bei der linearen Regressi

BeitragVerfasst: So 10. Nov 2019, 01:05
von strukturmarionette
Hi,

- was - Excel, Statistica, R ? - produziert denn diese Meldung konkret?

Gruß
S.

Re: Ausgeschlossene Dummy-Variable bei der linearen Regressi

BeitragVerfasst: So 10. Nov 2019, 10:15
von TiWas
Ich arbeite mit SPSS 26

Re: Ausgeschlossene Dummy-Variable bei der linearen Regressi

BeitragVerfasst: So 10. Nov 2019, 13:02
von strukturmarionette
Hi,

http://www.spss-forum.de/
- Wie sieht die Verteilung der kategorialen dichtomen UV-Variable aus?
- Wie lautet dessen konkrete Variablenbeschreibung (u.a., Typ, Missings ..)

Gruß
S.

Re: Ausgeschlossene Dummy-Variable bei der linearen Regressi

BeitragVerfasst: So 10. Nov 2019, 15:28
von TiWas
Variablenbeschreibung:
Typ: alle Numerisch, Werte jeweils 1 (erfüllt) und 0 (nicht erfüllt) pro Studierengang, Fehlende Werte: -99

Die Dummyvariablen haben jeweils eine Häufigkeit von ca. 80 pro Studiengang (1=erfüllt). Die augeschlossene Dummayvariable ist etwas rechtsschief. Kann das einen Einfluss haben? Wie kann es denn zustande kommen, dass bei der "Einschluss"-Methode trotzdem Variablen ausgeschlossen werden? Warum wird diese nicht einfach mit nicht signifikant/ kein Einfluss angezeigt?

Re: Ausgeschlossene Dummy-Variable bei der linearen Regressi

BeitragVerfasst: So 10. Nov 2019, 21:51
von strukturmarionette
Hi,

80 pro Studiengang (1=erfüllt)

- also 80 sind mit '1' codiert und wie viele jeweils mit '0'?

Gruß
S.

Re: Ausgeschlossene Dummy-Variable bei der linearen Regressi

BeitragVerfasst: So 10. Nov 2019, 23:41
von TiWas
Die TN den übrigen 3 Gruppen/Studiengänge (je ca. 240)

Re: Ausgeschlossene Dummy-Variable bei der linearen Regressi

BeitragVerfasst: Mo 11. Nov 2019, 00:31
von strukturmarionette
Hi,

- wenn du eine Dummycodierung für eine kategoriale UV (mit 4 Wertelabels) druchführst, reichen 3 Dummycodierungs-Variablen für die Abbildung der ursprünglich 4-stufigen kategoriale UV aus.

Gruß
S.