Regressionsanalyse, Kontrollvariablen

Regressionsanalyse, Kontrollvariablen

Beitragvon Domi829 » Do 15. Jun 2023, 12:54

Hallo zusammen,

für meine Masterarbeit muss ich folgende Hypothesen untersuchen:
H1,a: Aus den Selbsteinschätzungen der Lehrkräfte geht hervor, dass Lehrkräfte mit höheren transmissiven Überzeugungen vor der Pandemie (mtran_4) während der Pandemie Distanzunterricht mit geringerem Potenzial zur kognitiven Aktivierung (KA_5) geben.

H1,b: Über den Einfluss des technologisch-pädagogischen Wissens (DigM_5), der Schulform (xgym_5) und der technischen Ausstattung (AURes_5) hinaus, ergibt sich aus den Selbsteinschätzungen der Lehrkräfte, dass Lehrkräfte mit höheren transmissiven Überzeugungen vor der Pandemie während der Pandemie Distanzunterricht mit geringerem Potenzial zur kognitiven Aktivierung geben.

Als Methode zur Überprüfung der Hypothesen soll ich eine lineare Regression und dann unter Einbezug der KV (in H1,b) eine multiple Regression rechnen unter Berücksichtigung der Voraussetzungen.

Zu meiner Frage:
Wie sieht meine multiple Regression genau aus, folgende Ideen habe ich 1. alle KV als Prädiktoren einbeziehen also
lm(KA_5 ~ mtran_4+DigM_5+AURes_5+xgym_5, data = ...), wobei xgym_5 die Schulform (0 = kein Gymnasium, 1 = Gymnasium) ist.
2. Die Schulform zur Selektion des Datensatzes nutzen, wenn ich mir nur die Fälle anschaue an Gymansien
lm(KA_5 ~ mtran_4+DigM_5+AURes_5, data = ..., subset = (xgym_5 == 1))
Andernfalls verstehe ich nicht, was die Interpretation des Regressionskoeffizienten für die Schulform sein soll bei der ersten Idee auch wenn ich das nicht wissen muss bei der Interpretation meiner Ergebnisse bzw Beantwortung von 1,b

Vielen Dank im Voraus
Domi829
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Do 15. Jun 2023, 11:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse, Kontrollvariablen

Beitragvon bele » Do 15. Jun 2023, 14:49

Hallo Domi,

der Unterschied ist offensichtlich, dass im einen Fall alle Datensätze zum finden der Koeffizienten genutzt werden, im zweiten Fall nur die Gymnasiumsdatensätze. Nehmen wir an, in Nicht-Gymnasien gibt es einen total engen Zusammenhang zwischen KA_5 und mtran_4. Soll diese Information in das Ergebnis einfließen, oder soll sie außen vor bleiben?

Andernfalls verstehe ich nicht, was die Interpretation des Regressionskoeffizienten für die Schulform sein soll bei der ersten Idee


In dem von Dir formulierten Modell wird für Gymnasien ein konstanter Betrag mehr vorhergesagt als für Nicht-Gymnasien. Der Koeffizient von Gymnasium ist diese Konstante, um die im Gymnasium das KA_5 höher ist.

Ein dritter Ansatz könnten Interaktionsterme sein. Wenn Du beispielsweise wissen wolltest, ob der Koeffizient für mtran_4 in Gymnasien höher ist als in Nicht-Gymnasien, dann müsstest Du einen Interaktionsterm (oder mehrere Interaktionsterme) mit ins Modell aufnehmen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5813
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1367 mal in 1354 Posts


Zurück zu Faktorenanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast