Seite 1 von 1

Anfängerfragen

BeitragVerfasst: Sa 8. Apr 2017, 23:56
von _Mandy_
Huhu,

ich hoffe mir kann Jemand weiterhelfen. Ich muss mich in einer Hausarbeit mit SPSS Regressionen beschäftigen und bin absoluter Beginner. Ich untersuche mögliche Prädiktoren auf die Anzahl der aktiven Atomkraftwerke in den EU 28 Ländern
Meine AV ist also die Anzahl der Atomkraftwerke (metrisch). Als UV habe ich das BIP (metrisch). und das Umweltbewusstsein (nominal). Als Kontrollvariable das Kohlevorkommen (metrisch) und Postkommunismus (nominal).
Ich soll eine bivariate und eine multivariate Analyse durchführen.

Nun möchte ich einfach sicher gehen, dass ich beim weiteren Vorgehen auch richtig bin. Ich würde
- Die Normalverteilung aller Variablen (UV, AV und Kontrollvariable) überprüfen (anhand von Chi-Quadrat bzw. kolmogorov smirnov, das hat SPSS mir automatisch bei der Hypothesentestübersicht angezeigt)
- Für die bivariate Analyse, würde ich da bivariate Korrelationen oder partielle Korrelationen berechnen? Ist der Unterschied lediglich darin, dass bei der partiellen die Kontrollvariablen rausgerechnet werden? Wäre dies in meinem Zusammenhang sinnvoller? Oder kann ich auch die bivariaten Korrelationen berechnen und die Kontrollvariablen, die nicht signifikant sind, dann einfach aus dem Modell rausschmeißen und sie bei der multivariaten Analyse nicht mit einbeziehen?
- Bei der multivarianten Analyse würde ich dann eine lineare Regression durchführen, in Block 1 meine beiden Kontrollvariablen und in Block 2 dann meine beiden UVs?
- Nun habe ich ja ein sehr kleines N (n=28) Muss ich in diesem Fall dann das korrigierte r Quadrat in meine Interpretation einbeziehen?
- Muss ich sonst noch etwas überprüfen bevor ich die Regressionen durchführe?

Vielen lieben Dank schon mal für eure Hilfe. Ich hoffe das sind nicht allzu dumme Fragen aber nach zwei Tagen Internet Recherche bin ich auch nicht weiter und hoffe nun auf Hilfe von hier.

LG
Mandy

Re: Anfängerfragen

BeitragVerfasst: So 9. Apr 2017, 02:15
von strukturmarionette
Hi,

Nun möchte ich einfach sicher gehen, dass ich beim weiteren Vorgehen auch richtig bin. Ich würde
- Die Normalverteilung aller Variablen (UV, AV und Kontrollvariable) überprüfen

- Was oder wer empfiehlt sowas?
- Wie kann sowas überhaupt gehen bei nominalskalierten Variablen?

aber nach zwei Tagen Internet Recherche bin ich auch nicht weiter

- wo dort?

Gruß
S.

Re: Anfängerfragen

BeitragVerfasst: So 9. Apr 2017, 09:35
von _Mandy_
Die Normalverteilung hab ich bei spss mit der hypothesenübersicht untersucht.
Das ist doch die Voraussetzung für eine Regression oder?

Re: Anfängerfragen

BeitragVerfasst: So 9. Apr 2017, 10:17
von PonderStibbons
Wer erzählt denn sowas? Und dann auch noch bezogen auf die "unabhängigen" Variablen? Und wie bereits gefragt, wie sollte das überhaupt möglich sein bei kategorialen Variablen?

Mit freundlichen Grüßen

PonderStibbons

Re: Anfängerfragen

BeitragVerfasst: So 9. Apr 2017, 12:19
von _Mandy_
Okay danke für eure Hilfe. Dann kann ich die Prüfung auf Normalverteilung weg lassen.
Wie sieht es sonst mit meinem Vorgehen aus?

Re: Anfängerfragen

BeitragVerfasst: So 9. Apr 2017, 12:34
von PonderStibbons
Überprüfen musst Du wegen der kleinen Fallzahl die Vorhersagefehler (Residuen) Deines Modells,
diese sind es, die aus einer normalverteilten Grundgesamthit stammen sollten. Besser mit einem
P-P-Plot oder Q-Q-Plot als mit einem Test - sind die Abwechungen nur klein, kan man oft auch eine
Nicht-Normalverteilung in Kauf nehmen.

Die Variablenbeschreibung ist leider unzureichend, sind "Umwelbewusstsein" und "Postkommunismus"
zwei ja/nein-Variablen? n=28 ist für 4 Prädiktoren eigentlich zu wenig, aber wenn es nur eine
Fingerübung sein soll, geht das wohl.

Bivariate Analysen sind bivariate Analysen, da hat Auspartialisieren nichts verloren.

Ob Du blockweise vorgehen solltest, hängt von den Gewohnheiten bzw. Erwartungen Deiner
Aufgabensteller ab.

- Muss ich sonst noch etwas überprüfen bevor ich die Regressionen durchführe?

Such mal im Netz nach "linear regression assumptions" oder "Voraussetzungen lineare
Regression".

Mit freundlichen Grüßen

PonderStibbons

Re: Anfängerfragen

BeitragVerfasst: So 9. Apr 2017, 12:46
von _Mandy_
PonderStibbons hat geschrieben:Überprüfen musst Du wegen der kleinen Fallzahl die Vorhersagefehler (Residuen) Deines Modells,
diese sind es, die aus einer normalverteilten Grundgesamthit stammen sollten. Besser mit einem
P-P-Plot oder Q-Q-Plot als mit einem Test - sind die Abwechungen nur klein, kan man oft auch eine
Nicht-Normalverteilung in Kauf nehmen.

Die Variablenbeschreibung ist leider unzureichend, sind "Umwelbewusstsein" und "Postkommunismus"
zwei ja/nein-Variablen? n=28 ist für 4 Prädiktoren eigentlich zu wenig, aber wenn es nur eine
Fingerübung sein soll, geht das wohl.

Bivariate Analysen sind bivariate Analysen, da hat Auspartialisieren nichts verloren.

Ob Du blockweise vorgehen solltest, hängt von den Gewohnheiten bzw. Erwartungen Deiner
Aufgabensteller ab.

- Muss ich sonst noch etwas überprüfen bevor ich die Regressionen durchführe?

Such mal im Netz nach "linear regression assumptions" oder "Voraussetzungen lineare
Regression".

Mit freundlichen Grüßen

PonderStibbons



Super! Vielen lieben Dank! Das hilft mir um einiges weiter!

Postkommunismus ist 1/0 Umwelbewusstsein kategorial.

Also würde ich die Kontrollvariablen in der bivariaten Regression einfach wie die anderen UVs einbeziehen?

Ich kenne nur die blockweise vorgehensweise, in der dann die Drittvariablen kontrolliert werden. Was wäre die Alternative?

Re: Anfängerfragen

BeitragVerfasst: So 9. Apr 2017, 13:07
von PonderStibbons
Umwelbewusstsein kategorial.

Das ist nach wie vor unzureichend beschrieben, die Anzahl der Kategorien ist nicht genannt.
Bei k Kategorien sind kategoriale Variablen in k-1 dummy-Variablen umzuwandeln.
Das heißt, Du hast insgesamt mindestens 5 Variablen in der Regression, was wie
gesagt für n=28 zu viel wäre.
Also würde ich die Kontrollvariablen in der bivariaten Regression einfach wie die anderen UVs einbeziehen?

Wovon das abhängt, habe ich bereits geschrieben. Aus Sicht der Regressionsnalyse
gibt es keine Kontrollvaroablen, der Algorithmus weiß ja nicht, was der Anwender
sich so denkt.

Mit freundlichen Grüßen

PonderStibbons

Re: Anfängerfragen

BeitragVerfasst: Mi 12. Apr 2017, 10:06
von _Mandy_
Vielen Dank für die Hilfe. Umweltbewusstsein waren 4 Ausprägungen, ich habe da wie du gesagt hast eine Dummy-Variable erstellt.

Nun noch eine Frage: Für die multiple Regression, was gibt es da noch für eine Möglichkeit ohne zwei Blöcke? Alle UVs + Kontrollvariablen gleichwertig in die Regression einbauen? Oder wie würdet ihr das machen?
Ist es sinnvoll die Kontrollvariablen, da sie in der bivariaten Analyse nicht signifikant sind gar nicht in die multiple Regression einzubauen? So habe ich nur 2 UVs
Schau ich bei der Interpretation dann das korrigierte r Quadrat an doer was intepretiere ich bei einem kleinen N am besten?


PonderStibbons hat geschrieben:
Umwelbewusstsein kategorial.

Das ist nach wie vor unzureichend beschrieben, die Anzahl der Kategorien ist nicht genannt.
Bei k Kategorien sind kategoriale Variablen in k-1 dummy-Variablen umzuwandeln.
Das heißt, Du hast insgesamt mindestens 5 Variablen in der Regression, was wie
gesagt für n=28 zu viel wäre.
Also würde ich die Kontrollvariablen in der bivariaten Regression einfach wie die anderen UVs einbeziehen?

Wovon das abhängt, habe ich bereits geschrieben. Aus Sicht der Regressionsnalyse
gibt es keine Kontrollvaroablen, der Algorithmus weiß ja nicht, was der Anwender
sich so denkt.

Mit freundlichen Grüßen

PonderStibbons

Re: Anfängerfragen

BeitragVerfasst: Mi 12. Apr 2017, 10:54
von PonderStibbons
Umweltbewusstsein waren 4 Ausprägungen, ich habe da wie du gesagt hast eine Dummy-Variable erstellt.

Ist das ein Versehen?
Ich schrieb: Bei k Kategorien sind kategoriale Variablen in k-1 dummy-Variablen umzuwandeln., demnach sind bei 4 Ausprägungen 3 dummy-Variablen zu erzeugen.
Nun noch eine Frage: Für die multiple Regression, was gibt es da noch für eine Möglichkeit ohne zwei Blöcke? Alle UVs + Kontrollvariablen gleichwertig in die Regression einbauen?

Ja, alles in einem Rutsch, was auch sonst.
Oder wie würdet ihr das machen?

Wie wir das machen, ist eher Wumpe, es ist Dein Betreuer/Gutachter, der das goutieren muss.
Ist es sinnvoll die Kontrollvariablen, da sie in der bivariaten Analyse nicht signifikant sind gar nicht in die multiple Regression einzubauen? So habe ich nur 2 UVs

Wird gerne gemacht, ist aber nur eine Verschleierungstechnik. Das
multiple Regressionsmodell "weiß" ja dann nicht, dass schon vorher
fleißig getestet und ausgewählt wurde. Demnach sind die Standardfehler
und p-Werte der Regression nicht korrekt. Zu viele Prädiktoren bleiben
zu viele Prädiktoren, ob mit pre-Tests oder gleich mit Einbezug aller
Variablen in die Regression.

Schau ich bei der Interpretation dann das korrigierte r Quadrat an doer was intepretiere ich bei einem kleinen N am besten?

Halt alles.