Interpretation einer Regressionsgleichung mit Interaktionen

Alle Verfahren der Regressionanalyse.

Interpretation einer Regressionsgleichung mit Interaktionen

Beitragvon romi » Do 1. Aug 2024, 13:28

Hallo,

ich habe bereits herausgefunden, dass an einem Streiktag das Pkw-Aufkommen ansteigt. Nun möchte ich untersuchen, ob das Vorliegen eines Streiks, das Pkw-Aufkommen während der Hauptverkehrszeiten erhöht. Dafür habe ich eine Dummy "Verkehrszeiten", die sich in HVZ_morgens, HVZ_abends und Nebenverkehrszeit (Referenzkategorie) unterteilt.

Regressionsgleichung (Kontrollvariablen und fixe Effekte hier außenvorgelassen): log(Anzahl Pkw pro Stunde) = ß0 + ß1(=1.05) *HVZ_morgens + ß2(=1.20) HVZ_abends + ß3(=0.05) Streiktag + ß4(=0.11) HVZ_morgens*Streiktag + ß5(=0.07) HVZ_abends*Streiktag + u -> alle in Klammern angegeben Koeffizienten sind signifikant

Ich bin mir unsicher, ob meine Interpretation korrekt und vollständig ist, wenn ich für die morgendliche Hauptverkehrszeit nur den Koeffizienten ß4 interpretiere. Also schreibe, dass an einem Streiktag das Pkw-Aufkommen während der morgendlichen Hauptverkehrszeit um zusätzliche 11 Prozent ansteigt und somit den Anstieg der morgendlichen Hauptverkehrszeit verstärkt. Jedoch ist doch genau das die Differenz zu dem Anstieg der morgendlichen Verkehrszeit oder? Muss ich den Koeffizienten noch in Kombination mit anderen Effekten interpretieren?

Insgesamt bin ich mir mit der gesamten Interpretation unsicher und habe leider keine Literatur oder Blogeinträge gefunden, die mir eine klare Vorlage zur Interpretation gegeben haben.

Falls sich jemand meldet, schon mal vielen Dank :)
romi
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 1. Aug 2024, 12:58
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Interpretation einer Regressionsgleichung mit Interaktio

Beitragvon bele » Do 1. Aug 2024, 14:14

Hallo romi,

romi hat geschrieben:Also schreibe, dass an einem Streiktag das Pkw-Aufkommen während der morgendlichen Hauptverkehrszeit um zusätzliche 11 Prozent ansteigt und somit den Anstieg der morgendlichen Hauptverkehrszeit verstärkt.


Hallo Romi, dafür brauchst Du keine Vorlagen, keine Blogbeiträge und keine Literatur, das kannst Du mit reinem Nachdenken lösen. Du behauptest eine 11 % Steigerung(*) und musst Dir ganz genau überlegen, worüber die Steigerung hinaus geht. Wenn ich den von mir zitierten Satz oben richtig verstehe, dann vergleichst Du einen Streiktag morgens mit einem Nicht-Streiktag morgens. Richtig? Was bedeutet das für alle Dummyvariablen im Modell? Welche sind in den beiden verglichenen Situationen Null und welche Eins? Welche beta werden dabei aktiv geschaltet und welche nicht? Welche ändern sich zwischen den beiden verglichenen Situationen?
Wie vergleichst Du den morgendlichen Verkehr an einem Streiktag mit dem nicht-morgendlichen Verkehr an einem Streiktag?

Wenn Du Dir bewusst wirst, welche Situationen gerade ganz präzise vergleichst und wie sich das in beiden Situationen in den Dummyvariablen wiederspiegelt, dann kommst Du ganz von selbst auf die Antwort. Bestimmt!

LG,
Bernhard



(*) was eine 11 % Steigerung ist hängt sehr davon ab, ob Dein Statitiksystem den dekadischen Logarithmus verwendet oder einen natürlichen Logarithmus oder den mit Basis zwei. Das war zwar hier bestimmt nicht Deine Frage, gehört zur Antwort aber irgendwie dazu.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5871
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1384 mal in 1370 Posts

folgende User möchten sich bei bele bedanken:
romi

Re: Interpretation einer Regressionsgleichung mit Interaktio

Beitragvon romi » Do 1. Aug 2024, 15:15

Hallo Bernhard,

erstmal vielen Dank für die schnelle Reaktion!

Genau das hatte ich schon gemacht, war mir aber unsicher, ob es korrekt ist.

Situation 1: HVZ_morgens (1) und Kein Streiktag (0) -> log(Anzahl Pkw) = ß0 + ß1*1 + ß2*0 + ß3*0 + ß4(1*0) + ß5(0*0) = ß0 + ß1
Situation 2: HVZ_morgens (1) und Streiktag (1) -> Log (Anzahl Pkw) = ß0 + ß1*1 + ß2*0 + ß3*1 + ß4(1*1) + ß5(0*1) = ß0 + ß1 + ß3 + ß4

Dementsprechend wäre die Differenz ß3 + ß4. Also wäre der zusätzliche Effekt eines Streiks auf das Pkw-Aufkommen in der morgendlichen Hauptverkehrszeit 17,4 Prozent(= e^0.05+0.11)?

Selbige Berechnung dann für die abendliche Hauptverkehrszeit.

Der Austausch hilft mir gerade ungemein, danke!

Kurz noch zum Logarithmus: Ich habe gelernt log-lin Regressionen, wie oben in der Berechnung zu berechnen und prozentual zu interpretieren. Tiefer sind wir in den Vorlesungen nie in das Thema rein gegangen ...
romi
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 1. Aug 2024, 12:58
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Interpretation einer Regressionsgleichung mit Interaktio

Beitragvon bele » Do 1. Aug 2024, 15:43

Hallo Romi,

romi hat geschrieben:Dementsprechend wäre die Differenz ß3 + ß4.


Und, ist das nicht ein schönes Gefühl, das ohne einen Blogpost und dafür durch eigenes Verstehen zu lösen? Prima!


Kurz noch zum Logarithmus: Ich habe gelernt log-lin Regressionen, wie oben in der Berechnung zu berechnen und prozentual zu interpretieren. Tiefer sind wir in den Vorlesungen nie in das Thema rein gegangen ...


Auch das kann man auch als Nichtmathematiker verstehen: In der Schule hast Du mal gelernt, dass .

Wenn Du also auf der rechten Seite addierst, dann ist das so, als würdest Du auf der linken Seite mit multiplizieren. Du addierst und wenn log dabei für den natürlichen Logarithmus steht, dann folgt daraus

Und ja, mit 1,17 multiplizieren ist soviel wie 17 % auf draufschlagen. Deshalb ist es hier auch sinnvoll, mit Logarithmus zu rechnen: Es ist viel plausibler, dass 17 % der Menschen vom ÖPNV auf's Auto umsteigen als dass 7.500 Menschen in jeder untersuchten Stadt vom ÖPNV auf's Auto umsteigen.

Viel Erfolg weiter,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5871
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1384 mal in 1370 Posts

folgende User möchten sich bei bele bedanken:
romi

Re: Interpretation einer Regressionsgleichung mit Interaktio

Beitragvon romi » Do 1. Aug 2024, 16:33

Vielen vielen Dank für deine super Erklärungen und Unterstützung!
romi
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 1. Aug 2024, 12:58
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Interpretation einer Regressionsgleichung mit Interaktio

Beitragvon romi » Fr 2. Aug 2024, 13:42

Mir ist beim Auswerten einzelner Städte noch die Frage aufgekommen, wie ich mit nicht statistisch signifikanten Effekten umgehe.

Ist es korrekt, dass ein statistisch nicht signifikanter ß3-Koeffizient für die Interpretation egal ist? Also, dass ich dann trotzdem die Aussage treffen kann, dass der zusätzliche Effekt eines Streiks auf das Pkw-Aufkommen in der morgendlichen Hauptverkehrszeit bei (ß3 + ß4*** =) 17,4 Prozent liegt?

Lediglich, wenn ß4 nicht signifikant ist, heißt dies, dass das Vorliegen eines Streiks keinen Effekt auf die morgendliche Hauptverkehrszeit hat.

Liebe Grüße und danke :)
romi
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Do 1. Aug 2024, 12:58
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Interpretation einer Regressionsgleichung mit Interaktio

Beitragvon bele » Fr 2. Aug 2024, 21:25

romi hat geschrieben:Ist es korrekt, dass ein statistisch nicht signifikanter ß3-Koeffizient für die Interpretation egal ist? Also, dass ich dann trotzdem die Aussage treffen kann, dass der zusätzliche Effekt eines Streiks auf das Pkw-Aufkommen in der morgendlichen Hauptverkehrszeit bei (ß3 + ß4*** =) 17,4 Prozent liegt?


Das bleibt die beste Schätzung die Du hast.

Lediglich, wenn ß4 nicht signifikant ist, heißt dies, dass das Vorliegen eines Streiks keinen Effekt auf die morgendliche Hauptverkehrszeit hat.


Nein. Das heißt es nicht.

GLG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5871
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1384 mal in 1370 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron