Seite 1 von 1

Nominalskalierte Variablen in REgressionsanalyse?

BeitragVerfasst: Do 9. Okt 2014, 17:55
von maverick88
Hallo,

im Rahmen meiner MAsterarbeit untersuche ich das Mobilitätsverhalten von Jugendlichen.

Nun möchte ich ein paar REgressionsanalysen machen: Zum einen möchte ich herausfinden, ob sich die Variable Anzahl der Wege am Tag durch die Variablen Radbesitz (1 ja 0 nein), Autobesitz (1ja 0nein) Besitz eines ÖPNV Tickets (1ja nein0), aktuelle Tätigkeit (1 Schule 2 Ausbildung 3 Studium usw.), Geschlecht (1m 2w), Alter und Milieu (1 Milieu 1, 2 Milieu 2, 3 Milieu 3) erklrären lässt. Nun hab ich in einem SPSS Buch gelsen, dass Radbesitz, Autobesitz und Ticket trotz der nominalen Skalierung verwenden lassen, die Variablen aktuelle Tätigkeit und Milieu in Dummy Variablen mit (1 und 0) codiert werden müssen und Geschlecht, weil es dichotom ist auch verwendet werden kann. DAs Alter als Intervallskala ja sowieso. Wen ich die Sachen jetzt aber in die Lineare REgression von SPSS packe und die Methode Schrittweise (stand auch so im Buch) wähle, werden bis auf Rad und Autobesitz erstmal alle Variablen ausgeschlossen und der R² Wert ist auch nur noch sehr gering (0,135). Kann das sein? Oder kann man garkeine (und das vermute ich) Nominalskalierten Variablen zum erklären einer Intervallskalierten Variable verwenden?


Des Weiteren möchte ich gucken, ob sich der PKW Besitz (1 ja 0 nein) durch die variablen Einkommen (es gibt nur Klassen von 1 bis 9) Schulbildung (1: Grundschule, 2 Hauptschule, 3 Realschule, usw.) aktuelle Tätigkeit (1 Schule 2 Ausbildung 3 Studium usw.), Geschlecht (1m 2w) erklären lässt. Hier bin ich genauso vorgegangen, habe aber wieder auf Grund meines Buches, die Binäre logistische Regression gewählt.

Kann mir jemand helfen oder Tipps geben?

Vielen Dank

Re: Nominalskalierte Variablen in REgressionsanalyse?

BeitragVerfasst: Do 9. Okt 2014, 19:22
von DHA3000
1) Lies doch einmal in deiner SPSS-Fibel nach, was "schrittweise" bedeutet. Dann hast du die Antwort.

2) Und was ist deine Frage zur logitischen Regression? Ja - diese wird bei einer binären, abhängigen Variable angewendet.

Re: Nominalskalierte Variablen in REgressionsanalyse?

BeitragVerfasst: Fr 10. Okt 2014, 10:22
von PonderStibbons
Wennich die Sachen jetzt aber in die Lineare REgression von SPSS packe

Milieu und Tätigkeit nicht? Wie groß ist übrigens die Stichprobe?
und die Methode Schrittweise (stand auch so im Buch) wähle, werden bis auf Rad und Autobesitz erstmal alle Variablen ausgeschlossen und der R² Wert ist auch nur noch sehr gering (0,135). Kann das sein?

Siehe den Ratschlag von DHA3000. Aber R²=0,135 ist nicht klein,
oder welche Erwartung hattest Du?
Kann mir jemand helfen oder Tipps geben?

Konkret in welcher Hinsicht?

Mit freundlichen Grüßen

P.

Re: Nominalskalierte Variablen in REgressionsanalyse?

BeitragVerfasst: Fr 10. Okt 2014, 12:05
von maverick88
Hallo und Danke für die Antworten.

Also die Stichprobe Umfasst 180 Fälle.
Also sollte ich besser nicht Schrittweise machen, damit alle Variablen drinbleiben? Oder ist es sinnvoll Variablen ausschließen zulassen?
Wenn 0,135 nicht klein ist, besteht als ein linearer Zusammenhang? ICh dachte weil der Wert zwischen -1 und +1 liegen kann, ist der Wert nicht so gut...
Tut mir leid, ich bin ein absoluter Statistik Anfänger...

Milieu und Tätigkeit nicht, weil mehr als 2 Ausprägungen vorhanden sind, so habe ich es verstanden.

Und Hilfe/ Tipps nach dem Motto, wie ich sonst vorgehen kann um die besagten Variablen u erklären. Oder bin ich sogar auf dem richtigen weg, wenn mein R² garnicht so schlecht ist?

Re: Nominalskalierte Variablen in REgressionsanalyse?

BeitragVerfasst: Fr 10. Okt 2014, 12:34
von PonderStibbons
Also sollte ich besser nicht Schrittweise machen, damit alle Variablen drinbleiben? Oder ist es sinnvoll Variablen ausschließen zulassen?

Der Rat war, dass Du Dir das einmal anliest, worum es bei einer schrittweisen
Variablenselektion geht. Aber generell ist schrittweise meist keine gute Idee,
zumal wenn der Anwender nicht so recht weiß, was er da tut.
Wenn 0,135 nicht klein ist, besteht als ein linearer Zusammenhang?
ICh dachte weil der Wert zwischen -1 und +1 liegen kann, ist der Wert nicht so gut...

Das ist keine Korrelation, sondern R², die Varianzaufklärung
durch Dein Modell. Ein Quadratwert kann ja auch niemals
negativ sein.

In Wissenschaften, die sich mit lebendigen Wesen und deren
Verhaltensweisen beschäftigen, also von vielfältigen Faktoren
und Variablen beeinflussten Größen, was kann man denn da
als Varianzaufklärung realistisch erwarten?

Tut mir leid, ich bin ein absoluter Statistik Anfänger...

Ich weiß leider nicht recht, was ich mit dieser Aussage anfangen
soll. Es gibt ja auch noch Betreuer, akademische Statistikberatungen,
Kommilitonen oder bezahlte Statistikberatungen.
Milieu und Tätigkeit nicht, weil mehr als 2 Ausprägungen vorhanden sind, so habe ich es verstanden.

Dummy-codierung geht auch bei mit k > 2 (mehr als 2 Kategorien),
man muss dabei überlegen, welche Kategorie man weglässt.

Mit freundlichen Grüßen

P.