Seite 1 von 1

Welches Regressions-Modell verwenden?

BeitragVerfasst: Do 9. Jul 2020, 18:22
von lauilein
Hallo,

ich werte einen Fragebogen im Rahmen meiner Bachlorarbeit aus. Nun bin ich mir unsicher, welches Regressionsmodell ich bei folgenden Daten rechnen darf:
- n=203
- Daten sind nicht normalverteilt
- metrisch-skalierte unabhängige Variablen
- Variablen sind nicht-binär

Ich möchte die Wirkung von Variable X1 auf Y1 sowie die Wirkung von X2 und X3 auf Y1 herausfinden.

Könnt ihr mir hier evtl. weiterhelfen?
Vielen Dank!

Re: Welches Regressions-Modell verwenden?

BeitragVerfasst: Do 9. Jul 2020, 18:45
von strukturmarionette
Hi,

die erste Überlegung betrifft die AV.
- ?
- Messverfahren? - modalitäten?

- n=203

ok.

- Daten sind nicht normalverteilt

-> ist irrelevant

- metrisch-skalierte unabhängige Variablen

- ok

Variablen sind nicht-binär

- ?
Ich möchte die Wirkung von Variable X1 auf Y1 sowie die Wirkung von X2 und X3 auf Y1 herausfinden.

. s.o.

Gruß
S.

Re: Welches Regressions-Modell verwenden?

BeitragVerfasst: Do 9. Jul 2020, 19:03
von bele
Hi!

lauilein hat geschrieben:Ich möchte die Wirkung von Variable X1 auf Y1 sowie die Wirkung von X2 und X3 auf Y1 herausfinden.


Bedeutet das ein Modell mit X1, X2 und X3 als unabhängigen Variablen oder zwei verschiedene Modelle, eines mit X1 und eines mit X2+X3 als unabhängigen Variablen?

welches Regressionsmodell ich bei folgenden Daten rechnen darf


Mit drei quantitativen Unabhängigen und 200 Beobachtungen ließe sich schon ein kleines neuronales Netz trainieren. Ich vermute aber, dass Du gar kein neuronales Netz haben willst. Deshalb würde ich die Frage gerne umkehren: Welches Modell würdest Du denn gerne aufstellen?

LG,
Bernhard

Re: Welches Regressions-Modell verwenden?

BeitragVerfasst: Do 9. Jul 2020, 22:29
von lauilein
Hi!

Erst einmal vielen Dank für eure Antworten!
Ich führe mein Anliegen etwas genauer aus.

Ich habe eine Befragung mit einem wissenschaftlich getesteten Fragebogen durchgeführt, bei dem unterschiedliche Belastungen und Belastungsfolgen mittels Likert-Skala gemessen wurden. Bei der Auswertung habe ich mich an die Angaben des Originalautors gehalten. Die Antworten habe ich von 0=minimale Ausprägung in 25er Schritten bis 100=maximale Ausprägung codiert. Für die Auswertung wurden Themenblocks gebildet, welche aus mehreren Scores bestehen. Ein Score besteht wiederum aus einer unterschiedlichen Anzahl von Fragen (teilweise 1-7 Fragen). Für den ersten Teil meiner Auswertung habe ich den Mittelwert der Scores berechnet, indem ich eine neue Variable über SPSS gebildet habe. Ein Score heißt nun zum Beispiel Entwicklungsmöglichkeiten. Dieser stellt einer meiner "Belastung" dar. Nun gab es auch Scores, bspw. Arbeitszufriedenheit, welche als "Belastungsfolge" gelten.

Für die nachfolgenden Berechnungen verwende ich nun also immer die neu berechnete Mittelwert-Varibale (=Score).
Bisher habe ich nur den Zusammenhang mittels Spearman-Korrlearionskoeffizienten für all meine Belastungen und deren Folgen berechnet sowie bei einer Fragen den Unterschied zweier Gruppen, da ich bei der Folge Burnout die Variable dichotomisieren konnte. Zur Testung habe ich den Mann-Whitney-U-Tes genommen. Bei dem Test hat mir SPSS leider auch nicht das Konfìdenzintervall zur Signifikanztestung gegeben. Da mein Prof. dieses aber unbedingt haben möchte, tappe ich hier auch noch im Dunkeln und weiß nicht, wie ich es berechnen soll. Das Internet hilft mir leider auch nicht weiter.

Nun zu meinem eigentlichen Anliegen. Da ich einen Zusammenhang zwischen der Belastung und der Belastungsfolge herausgefunden habe (mittlere Effektstärke), will ich nun wissen, in wie weit meine Belastung meine Belastungsfolge beeinflusst. Eigentlich dachte ich, dass ich dies mit einem Regressionsmodell herausfinden kann. Leider wurde das Thema Regression gar nicht in unserer Statstikvorlesung behandelt. Deswegen sind meine Kenntnisse darüber auch nur selbst angelesen.

Wie oben schon erwähnt, habe ich n=203 und nicht normalsverteilte Daten.

Re: Welches Regressions-Modell verwenden?

BeitragVerfasst: Fr 10. Jul 2020, 00:31
von bele
Hallo,

das hat jetzt meine Frage
"
lauilein hat geschrieben:
Ich möchte die Wirkung von Variable X1 auf Y1 sowie die Wirkung von X2 und X3 auf Y1 herausfinden.



Bedeutet das ein Modell mit X1, X2 und X3 als unabhängigen Variablen oder zwei verschiedene Modelle, eines mit X1 und eines mit X2+X3 als unabhängigen Variablen


nicht wirklich beantwortet. Nach dem neuen Text muss man zunächst kritisch hinterfragen, ob die Scores, die nur aus einer Frage gebildet wurden tatsächlich als metrisch zu betrachten sind. Sagen wir, sie seien es. Dann hast Du mit der Spearman-Korrelation nach einem bivariaten monotonen Zusammenhang gesucht.

Diese Art von Untersuchungen werden meistens mit der linearen Regressionsanalyse durchgeführt, bei der Du im einfachsten Fall bivariat nach linearen Zusammenhängen suchst aber auch mehrere Prädiktoren für Y1 in einem Modell haben kannst. Such mal nach "ordinary least squares regression". Normalverteilung: Man prüft die Verteilung der Residuen _nach_ der linearen Regression. Normalverteilung der UV und AV ist wurscht.

LG,
Bernhard