STATISTIK-FORUM.de

Sappsallap · von **Sappsallap** » Di 20. Mär 2012, 12:06

Hallo,

ich habe 2 exogene Dummy-Variablen, nämlich "Women" (--> =1, falls Frau, =0, sonst) und "Banking" (--> =1 falls Unternehmen im Bankensektor, =0, sonst).

Nun habe ich die Hypothese, dass der Koeffizient zu "Women" insbesondere dann signifikant sein sollte, wenn Banking=0 ist.

Kann ich nun einfach die beiden Dummies miteinander multiplizieren? Wie würde ich es interpretieren, wenn zwar dieses Produkt insignifikant, jedoch der Dummy "Women" plötzlich signifikant wird?

Danke für Hilfe!!!!

PonderStibbons · von **PonderStibbons** » Di 20. Mär 2012, 12:18

Nun habe ich die Hypothese, dass der Koeffizient zu "Women" insbesondere dann signifikant sein sollte, wenn Banking=0 ist.

Vielleicht ist das nur unglücklich formuliert. Wörtlich genommen willst Du damit
eine Regression der AV auf Geschlecht nur in der Subgruppe Banking=0 rechnen.

Kann ich nun einfach die beiden Dummies miteinander multiplizieren?

Das wäre eine Wechselwirkung.

Wie würde ich es interpretieren, wenn zwar dieses Produkt insignifikant, jedoch der Dummy "Women" plötzlich signifikant wird?

Dass "Women" in Deinem Modell einen inferenzstatistisch signifikanten Effekt auf die AV hat.

Mit freundlichen Grüßen

P.

Holgonaut · von **Holgonaut** » Mo 26. Mär 2012, 13:04

Hi,

wenn du Geschlecht und banking multiplizierst bekommst du folgendes:
a) der intercept ist der Y-Mittelwert für männliche Banker
b) der Effekt von banking: Y-Mittelwertsunterschied zwischen Banken und sonstigen bei den Männern
c) der Effekt des Geschlecht: Y-Mittelwertsunterschied zwischen Männern und Frauen bei den sonstigen
d) Produktterm: Differenz der Y-Mittelwertsunterschiede - also ist die Differenz Männer vs. Frauen bei den sonstigen unterschiedlich von der Differenz der Geschlechter in den Banken.

Gruß
Holger

Berry · von **Berry** » Di 27. Mär 2012, 12:40

1. Wenn ich das richtig verstanden habe, dann hast du zwei dichotome kategorialen Kovariablen "Sex" und "Business" bzw. "Geschlecht" und "Branche".

2.

Sappsallap hat geschrieben:Nun habe ich die Hypothese, dass der Koeffizient zu "Women" insbesondere dann signifikant sein sollte, wenn Banking=0 ist.

Um deine Vermutung zu prüfen, kannst du doch die Referenzkategorie der Dummy-Kodierung der zweiten Einflussgröße ändern/umkehren so, dass diese gleich 1 bei sonst und 0 bei Unternehmen aus dem Bankensektor ist. Nur so kannst du dir das Produkt "Woman*notBanking" anschauen. Aber auch wenn dort eine gewisse Signifikanz festgestellt wird, muss es sachlogisch nicht unbedingt stimmen. D. h., dies ist schlecht verwertbar, denn, wenn ich es richtig verstehe, schmeisst du alle Branchen außer Bankensektor zusammen. So kann man keine Aussage über die einzelnen anderen Branchen sowie insgesamt (als Durchschnitt) treffen, denn diese Signifikanz kann ja (nur zufällig) entstehen, auch wenn tatsächlich keine Signifikanz in jeder einzelnen Branche vorliegt.

3.

Sappsallap hat geschrieben:Kann ich nun einfach die beiden Dummies miteinander multiplizieren?

Wenn du hierbei über das Produkt "Women*Banking" sprichst, dann heißt es, dass der Effekt auf die Zielvariable sich verstärkt, wenn eine Frau aus dem Bankensektor kommt. Also du kannst schon die beiden Dummies kreuzen. Wenn du jedoch über das Produkt "Woman*notBanking", dann gilt es auch. Zu Interpretationszwecken allerdings vgl. 2.

4.

Sappsallap hat geschrieben:Wie würde ich es interpretieren, wenn zwar dieses Produkt insignifikant, jedoch der Dummy "Women" plötzlich signifikant wird?

Habe ich das richtig verstanden: wenn du zuerst ein Modell ohne Interaktion bildest, dann ist der Dummy "Women" nicht (oder wenig) signifikant, und im Modell mit Interaktion, wird er plotzlich (hoch) signifikant, obwohl der Interaktionsterm "Woman*(not)Banking" nicht signifikant ist? Sowas kann ich mir schlecht vorstellen. Wie schauts mit Intercept aus? Ist dieser signifikant?

5. @Holgonaut:

Holgonaut hat geschrieben:Hi,

wenn du Geschlecht und banking multiplizierst bekommst du folgendes:
a) der intercept ist der Y-Mittelwert für männliche Banker
b) der Effekt von banking: Y-Mittelwertsunterschied zwischen Banken und sonstigen bei den Männern
c) der Effekt des Geschlecht: Y-Mittelwertsunterschied zwischen Männern und Frauen bei den sonstigen
d) Produktterm: Differenz der Y-Mittelwertsunterschiede - also ist die Differenz Männer vs. Frauen bei den sonstigen unterschiedlich von der Differenz der Geschlechter in den Banken.

Das bekommt der Sappsallap, wenn er Geschlecht und nicht-Banking multipliziert. Oder?
Und deine Beschreibung von d) ist mir nicht ganz klar: "...also ist die Differenz Männer vs. Frauen bei den sonstigen unterschiedlich von der Differenz der Geschlechter in den Banken." - ist es Differenz der Differenz oder fehlt da ein Satzzeichen?

6. Zu diesem Thema habe ich auch eigene Fragen:

1) Kann es vorkommen, dass eine (separat betrachtet) insignifikante Variable signifikante Interaktionsterme mit anderen in- oder signifikanten Variablen bildet. Falls ja, kann ich dann diese Variable (einzeln) aus dem Modell entfernen, die Interaktionen mit ihr aber beibehalten?

Als Beispiel 3 Kovariablen x1 und x2 (beide sign.) sowie x3 (insign.). Auch interaktion x1*x3 gelte als sign. Wäre es korrekt/möglich als Modell, anstatt

y ~ x1 + x2 + x3 + x1*x3,

y ~ x1 + x2 + x1*x3

zu nehmen?

daniel · von **daniel** » Di 27. Mär 2012, 13:04

Kann es vorkommen, dass eine (separat betrachtet) insignifikante Variable signifikante Interaktionsterme mit anderen in- oder signifikanten Variablen bildet. Falls ja, kann ich dann diese Variable (einzeln) aus dem Modell entfernen, die Interaktionen mit ihr aber beibehalten?

Als Beispiel 3 Kovariablen x1 und x2 (beide sign.) sowie x3 (insign.). Auch interaktion x1*x3 gelte als sign. Wäre es korrekt/möglich als Modell, anstatt

y ~ x1 + x2 + x3 + x1*x3,

y ~ x1 + x2 + x1*x3

zu nehmen?

Davon würde ich abraten. Mit welcher Begründung sollte man auch ein solches Modell aufstellen?

Ein insignifikanter Effekt von x3 in Deinem ersten Modell bedeutet lediglich, dass x3 keinen statistisch signifikanten Effekt hat, falls x1 Null ist. Es bedeutet keinesfalls, dass x3 keinen statisitsch signifikanten Effekt auf y hat. Ist die Interaktion statistisch signifikant, bedeuet das, dass es durchaus einen (statisitsch signifikanten) Effekt von x3 gibt, falls x1 von Null verschieden ist. Das zweite Modell impliziert dagegen, dass x3 unabhängig von der Ausprägung von x1 keinen Effekt auf y hat. Diese Annahme ist im Prinzip statistisch durch den signifikanten Interaktionsterm widerlegt. Interaktionen sind (zumindest statistisch) niemals als Einbahnstraße zu interpretieren. Den konditionalen Haupteffekt einer der am Produktterm beteiligten Variablen aus dem Modell zu entfernen ist daher keine gute Idee.

folgende User möchten sich bei daniel bedanken:
choco86

Holgonaut · von **Holgonaut** » Di 27. Mär 2012, 13:23

Berry,

du hast einen kleinen Denkfehler, der sich durch alle Kommentare zieht:
Du kannst nur VARIABLEN multiplizieren. Du schlägst mehrfach vor, einzelne Kategorien (z.B. women * not-banking) zu multiplizieren. Das ist aber jedes mal
eine Konstante, weil du zwei Konstanten multiplizierst.

Wenn er ein Modell OHNE produktterm macht (also ohne GENDER x BANKING), dann
a) ist der intercept der Y-Mittelwert für die 0 - 0 Kombi (also "Männer" und "sonstige")
b) der "Effekt" von Gender der Y-Mittelwertsunterschied zwischen Männern und Frauen (da es keine interaktion gibt, ist dieser Unterschied in beiden banking-Kategorien gleich
c) der "Effekt" von banking der Y-Mittelwertsunterschied zwischen banking und sonstigen (mit der selben Implikation wie "b")

In dem Moment wo der Produktterm signifikant ist - bedeutet das, dass der Unterschied z.B. zwischen Männern und Frauen in den beiden banking - Kategorien ungleich ist - d.h. es ist eine Differenz (über die banking Kategorien) in der Differenz (zwischen Männern und Frauen).

Ich hab "Effekt" in Anführungszeichen geschrieben, weil es kein Effekt gibt - der B-Koeffizient gibt den Mittelwertsunterschied zwischen den dummy-Stufen an.

Außerdem:
- Ich stimm dir zu, dass eine Kategorie "sonstige" schwierig zu interpretieren ist
- die Hypothese "dass der Koeffizient zu "Women" insbesondere dann signifikant sein sollte, wenn Banking=0 ist" unglücklich weil unpräzise formuliert ist (was heißt "insbesondere"). Vorschlag:
"Der Unterschied zwischen M und F ist im Bankensektor sign. geringer als in nicht-Banken-Sektoren" (--> über die Hypothese entscheidet die Sign. des Produktterms, weils hier um die Differenz der Differenz geht.

1) Kann es vorkommen, dass eine (separat betrachtet) insignifikante Variable signifikante Interaktionsterme mit anderen in- oder signifikanten Variablen bildet. Falls ja, kann ich dann diese Variable (einzeln) aus dem Modell entfernen, die Interaktionen mit ihr aber beibehalten?

Als Beispiel 3 Kovariablen x1 und x2 (beide sign.) sowie x3 (insign.). Auch interaktion x1*x3 gelte als sign. Wäre es korrekt/möglich als Modell, anstatt

y ~ x1 + x2 + x3 + x1*x3,

y ~ x1 + x2 + x1*x3

zu nehmen?
Berry
Beobachter

Beiträge: 15
Registriert: Mi 23. Nov 2011, 17:15
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Du meinst "eine Variable mit nicht-signifikantem Effekt"? Eine Variable ist nicht signifikant oder n.s.

Und ja - natürlich ist dies möglich. D.h. jede Variable alleine bewirkt nichts, aber wenn sie zusammenkommen schön. Stell dir vor:
a) X1: ein brennendes Feuerzeug kurz an den Arm halten
b) X2: etwas Benzin auf den Arm schütten.

Y: Entflammung des Arms

Beide haben alleine keinen Effekt - d.h. nix passiert wenn du sie alleine anwendest. Und jetzt der Produktterm. Rumms

Zu den Gleichungen: Wenn du einen Produkterm mit in ein Modell nimmst, müssen die Variable, die den Produktterm bilden mit in das Modell - hier also X3.

Gruß
Holger

Berry · von **Berry** » Di 27. Mär 2012, 17:31

Hi Holger,

ich habe keinen Denkfehler und sehe es genau so, wie du es beschreibst. Ich weiß ja, dass bei der Bildung von Interaktionen die ganzen Kovariablen und nicht ihre beliebige Ausprägungen multipliziert werden. Jedoch entstehen dabei kreuzweise die Produkte aus allen einzelnen Ausprägungen jeder der beiden produktbildenden Variablen, und jeder dieser Produkte ein eigenes beta erhält. Für kategoriale Variablen heißt es ja, dass die bei der Dummy-Kodierung entstandenen 0/1-kodierten Dummies bei der Interaktionsbildung auch als 0/1-Konstanten mit dem beta multipliziert werden. Betrachten wir mal das Modell aus den beiden Variablen mit und ohne Interaktion, wobei die Referenzkategorien "notWomen=Men" und "notBanking=Other" sind:

ohne Interaktion: y = b0 + b1*gender(women) + b2*business(banking) [ist übrigens äquivalent mit y = b0 + b1*women(ja=1) + b2*banking(ja=1)]
mit Interaktion: y = b0 + b1*gender(women) + b2*business(banking) + b3*gender(women):business(banking)

Mir ist klar, dass b0, b1 und b2 in beiden Modellen unterschiedlich sind. Jedoch bleibt in beiden Fällen nur das jeweilige b0 übrig bzw. als y-Ergebnis stehen nur dann, wenn es sich bei dem jeweiligen Datensatz um einen Mann aus dem Nicht-Bankensektor handelt und zwar unabhängig davon, ob die Interaktion ins Modell eingeschlossen ist oder nicht. Oder irre ich mich da?

Übrigens, wenn ich beispielsweise über "das Produkt "Women*Banking"" spreche, so meine ich ja auch nur den einzelnen Produkt und nicht den ganzen Interaktionsterm selbst. Ich habe niergendswo vorgeschlagen, einzelne Kategorien zu multiplizieren, und habe lediglich nur über die einzelnen Produkte gesprochen, die beim Multiplizieren von kategorialen Variablen entstehen. Mit meinem Ausdruck "Also du kannst schon die beiden Dummies kreuzen" wollte ich nur bei der (nicht korrekten) Ausdrucksweise "Kann ich nun einfach die beiden Dummies miteinander multiplizieren?" von Sappsallap bleiben.

Aber jedenfalls danke dir und auch daniel für Beantwortung meiner Fragen. Obwohl ihr beiden zum gleichen Egebnis kommt, finde ich eure Argumentationen etwas widersprüchlich, nämlich in

daniel hat geschrieben:Das zweite Modell impliziert dagegen, dass x3 unabhängig von der Ausprägung von x1 keinen Effekt auf y hat. Diese Annahme ist im Prinzip statistisch durch den signifikanten Interaktionsterm widerlegt. Interaktionen sind (zumindest statistisch) niemals als Einbahnstraße zu interpretieren.

und

Holgonaut hat geschrieben:Und ja - natürlich ist dies möglich. D.h. jede Variable alleine bewirkt nichts, aber wenn sie zusammenkommen schön. Stell dir vor:
a) X1: ein brennendes Feuerzeug kurz an den Arm halten
b) X2: etwas Benzin auf den Arm schütten.

Y: Entflammung des Arms

Beide haben alleine keinen Effekt - d.h. nix passiert wenn du sie alleine anwendest. Und jetzt der Produktterm. Rumms

Bei daniel heisst es, ist die Interaktion signifikant (= hat einen signifikanten Einfluss), so sollen auch die beiden einzelnen Haupteffekte signifikant sein. In deinem (gruseligen :shock:

) Beispiel ist zumindest X2 ohne einen signifikanten Einfluss auf die Zielvariable, der Interaktionsterm aber schon.

Wer hat da Recht? Oder verstehe ich da was falsch?

Holgonaut · von **Holgonaut** » Di 27. Mär 2012, 18:06

Hi,

Deine Erläuterung hab ich echt gesagt, nicht verstanden. Muss ich mir noch mal genauer anschauen.

Zu dem scheinbaren Widerspruch:

Daniel schreibt:

Ist die Interaktion statistisch signifikant, bedeuet das, dass es durchaus einen (statisitsch signifikanten) Effekt von x3 gibt, falls x1 von Null verschieden ist.

Was er hier explizit erläutert, ist ein "konditionaler Effekt" - kein (wie du schreibst) "Haupteffekt". Dies heißt, dass X3 *an einer bestimmten Stelle von x1* ("nicht 0"), einen Effekt hat.
Das ist exakt mein Beispiel: Das Feuerzeug hat einen Effekt wenn die zweite Variable "Benzin" von Null verschieden ist (also auf den Arm gegossen wird).

Ob das immer so sein muss, weiß ich aber nicht. Ich kann mir durchaus vorstellen, dass es einen sign. Interaktionseffekt gibt, ohne dass der Effekt von X3 an irgendeiner Stelle von X1
signifikant ist. Der Produktterm kennzeichnet ja die Signifikanz der Beugung der Regressionsfläche im Raum. Es kann durchaus sein, dass diese Beugung sign. ist - aber die Gerade an jeder Stelle
der moderierenden Variablen n.s. ist. Das ist ähnlich wie der ab und zu auftretende Fall, dass es einen Gruppenunterschied im Effekt einer Variable "A" gibt, der Effekt von A in beiden Gruppen aber nicht signifikant ist. Der Produktterm (Gruppe*A) gibt den Winkel zwischen beiden Regressionsgeraden an - die Geraden selbst sind aber nicht-sign. in ihrer Steigung.

Grüße
Holger

Berry · von **Berry** » Di 27. Mär 2012, 19:02

Es ist anscheinend meine schlechte Ausdrucksweise daran schuld, dass wir uns aneineander vorbei reden.

Aus der Aussage von daniel

daniel hat geschrieben:Das zweite Modell impliziert dagegen, dass x3 unabhängig von der Ausprägung von x1 keinen Effekt auf y hat. Diese Annahme ist im Prinzip statistisch durch den signifikanten Interaktionsterm widerlegt. Interaktionen sind (zumindest statistisch) niemals als Einbahnstraße zu interpretieren.

kann ich schlussfolgern, dass wenn der Interaktionsterm x1*x3 einen signifikanten Einfluss hat, so kann der Term "+x3" nicht insignifikant sein.

Wenn ich für dein Beispiel als Zielvariable "größere Brandwunde" definiere, dann hat die Variable "Feuerzeug" auf jeden Fall einen signifikanten Einfluss, die Variable "Benzin auf den Arm gießen" jedoch nicht. Bei der Bildung des Wechselwirkungsterms wird aber der Einfluss der ersten (sign.) Variablen durch die zweite (insign.) Variable verstärkt.

Na ja, egal, ich glaube nicht, dass ich doch noch verstanden werde.

Nichtsdestotrotz habe ich jetzt eine weitere Frage:

Ich habe im Buch "Kriminologie und wissensbasierte Kriminalpolitik: Entwicklungs- und Evaluationsforschung" von Friedrich Lösel,Doris Bender,Jörg-Martin Jehle folgende aussage gelesen:

"Signifikante konditionale Effekte widersprechen der Annahme homogener Fehlervarianzen in den ... Gruppen..."

Heisst es, man soll keine Interaktionen betrachten, damit die Modellannahme homogener Fehlervarianzen nicht verletzt wird, also entweder Interaktionen oder homogene Fehlervarianzen?

Holgonaut · von **Holgonaut** » Di 27. Mär 2012, 22:11

Hi Berry,

kann ich schlussfolgern, dass wenn der Interaktionsterm x1*x3 einen signifikanten Einfluss hat, so kann der Term "+x3" nicht insignifikant sein.

Den Effekt von X3 nennt man first-order-Effekt- es ist derjenige Effekt, wenn der Moderator (X1) gleich 0 ist. Wenn er also sign. ist, ist der Effekt von X3 bei X1=0 sign. Wenn zusätzlich der Produktterm
signifikant ist, steigt der Effekt von X3 entlang der Werte von X1 kontinuierlich an. Die Regressionsfläche ist also in die Tiefe/z-Ebene (d.h. entlang der X3-Dimension) nach oben gebogen.

Wenn ich für dein Beispiel als Zielvariable "größere Brandwunde" definiere, dann hat die Variable "Feuerzeug" auf jeden Fall einen signifikanten Einfluss, die Variable "Benzin auf den Arm gießen" jedoch nicht. Bei der Bildung des Wechselwirkungsterms wird aber der Einfluss der ersten (sign.) Variablen durch die zweite (insign.) Variable verstärkt.

"Größere Brandwunde" ist eine unglückliche Formulierung für eine VARIABLE. Meinst du "Größe der Brandwunde"? Wenn ja: sie könnte die Ausprägung von 0 (keinerlei Spuren von Verbrennung) über 1 (leichte Rötung), 2 (starke Rötung), und 3 (sehr starke Rötung) gehen.

Dann haben wir den obigen Fall. Die Variable Feuerzeug (mal definiert von 0 (0 Sekunden an den Arm halten) bis 5 (5 Sekunden) hätte einen first-order-Effekt - d.h. auch ohne Benzin (Benzin = 0) würde eine Erhöhung der "Feuer-Zeit" eine Erhöhung der Rötung/Verbrennung nach sich ziehen. Allerdings wäre der Effekt um einiges intensiver (und sogar exponentiell), wenn Benzin = 1 ist.

Das mit den Fehlervarianzen sagt mir nix und ich sehe auch keinen Bezug zu unserer Diskussion.

Grüße
Holger

STATISTIK-FORUM.de

Interaktionseffekt

Interaktionseffekt

Re: Interaktionseffekt

Re: Interaktionseffekt

Re: Interaktionseffekt

Re: Interaktionseffekt

Re: Interaktionseffekt

Re: Interaktionseffekt

Re: Interaktionseffekt

Re: Interaktionseffekt

Re: Interaktionseffekt

Wer ist online?