STATISTIK-FORUM.de

PewPew · von **PewPew** » Mi 28. Jan 2015, 23:58

Guten Abend allseits,

bevor ich anfange, möchte ich mich gleich entschuldigen für eventuelle Unwissenheiten meinerseits. Ich schreibe aktuell meinen Bachelor und es handelt sich um meine erste empirische Arbeit und meine erste, wirkliche Auseinandersetzung mit Statistik (das Uni-Modul hatte so ungefähr Mittelwert, Median und Korrelationskoeffizienten; das wars).

Thematisch dreht es sich um die Auswirkungen des Supports von Modifications/Modding-Communities bei Spiele-Entwicklern auf die Kundenbindung. Ich habe im Zuge dessen 12 Hypothesen aufgestellt, bei acht davon handelt es sich um einfache Zusammenhangs-Hypothesen (Je ..., desto ...), die ich mittels einfacher Korrelationen verifizeren konnte (6/8 waren signifikant). Die letzten vier sind "Moderatorhypothesen", ich möchte also untersuchen, wie sich einige Variable auf die zuvor festgestellten Zusammenhänge auswirken. Beispielhaft nenne ich einfach mal die erste, die ich analysiert habe und in der gleich Interpretations-Probleme aufkamen:

Zusammenhangshypothese: Je positiver der Mod-Support bewertet wird, desto stärker ist Faktor X der Kundenbindung (mein Kundenbindungskonstrukt besteht aus vier Faktoren mit jeweils 3-5 Indikatoren).

Diese Hypothese konnte ich, wie bereits erwähnt, mit p <=0,001 und r=0,242 bestätigen. Der Zusammenhang ist nicht besonders stark, davon war ich aber auch ausgegangen; Kundenbindung ist ein sehr komplexes Konstrukt mit vielen Einflussfaktoren.

Moderatorhypothese: Das Involvement stellt einen positiven Moderator für den Zusammenhang zwischen der Bewertung des Mod-Supports und den Faktoren der Kundenbindung dar.

Alle relevanten Datensätze sind Likert-Skalen und werden als intervallskaliert betrachtet. Die Normalverteilung lässt zu wünschen übrig, allerdings ist das zu erwarten, da die Umfrage innerhalb der Fan-Community stattgefunden hat, die zu positiveren Bewertungen neigen wird (Annahme). Außerdem habe ich gelesen, dass ab einer gewissen Stichprobengröße die Normalverteilung keine notwendige Bedingung mehr darstellt? Andernfalls müsste ich wahrscheinlich vollkommen anders vorgehen. N = 225 übrigens.

Vorgehensweise:
1. Schritt: Berechnung einer Interaktionsvariablen aus "Bewertung des Mod-Supports" (=MS) x "Involvement" (=IV) = MSxIV
2. Schritt: Lineare Regression in SPSS, Abhängige Variable: Kundenbindungsfaktor X (KB_X), Unabhängige Variablen: MS, IV, MSxIV

R = 0,320; R²=0,102

Soweit, so (un)klar. Sieht eher nicht besonders beeindruckend aus, wenn ich das richtig interpretiere ist der Moderationseffekt sehr gering? Wäre die korrekte Interpretation: Wenn IV um 1 steigt nimmt der Zusammenhang (=Korrelation) von MS & KB_X um 10,2% zu (?).

Was mich allerdings sehr verwirrt ist die Koeffizienten-Tabelle. Dort steht bei Beta (sorry, weiß nicht wie man hier griechische Buchstaben einfügt) für IV -0,384 (p = 0,025), bei MS -0,182 (p = 0,226; nicht signifikant) und bei IVxMS 0,712 (p = 0,003).

Wie kann Beta für MS negativ sein, wenn die Korrelation zu KB positiv ist? Das erscheint mir paradox.

Ich würde dieses Problem gerne aufklären, bevor ich anfange, die nächsten drei Moderatorhypothesen zu prüfen.

Vielen Dank im Vorraus für Eure Hilfe,

Pew

PS. Ich wäre nicht ganz undankbar, wenn Ihr bei Euren Erklärungen davon ausgeht, dass ich ein Idiot bin.

PonderStibbons · von **PonderStibbons** » Do 29. Jan 2015, 11:39

Außerdem habe ich gelesen, dass ab einer gewissen Stichprobengröße die Normalverteilung keine notwendige Bedingung mehr darstellt?

Die Normalverteilung von Variablen ist nie eine notwendige
Bedingung für Tests im allgemeinen linearen Modell. Allenfalls
die Verteilung der Vorhersagefehler (Rediduen). Bei n > 50
können die aber auch einer nicht-normalen Population stammen.

Wie kann Beta für MS negativ sein, wenn die Korrelation zu KB positiv ist? Das erscheint mir paradox.

Du hast aber jetzt weitere Prädiktoren im Modell. Der Effekt
von IV kann nur noch interpretiert werden, wenn man daran
denkt, wie gleichzeitig die beiden anderen Prädiktoren
auf die AV wirken. Die IV ist ja auch quasi jetzt zweimal
in der Gleichung, einmal für sich, einmal eingeflossen in
die Interaktion. Das sehr hohe Gewicht der Interaktion
verändert markant das Gewicht von IV-alleine in der Gleichung.
Ich vermute, dass im Effekt die Werte für AV mit steigendem IV
ebenfalls ansteigen (weil IV in der hochgewichtigen Interaktion
steckt), dass dieser Anstieg aber für hohe Werte von M steiler ist
(in etwa wie hier http://www.google.de/imgres?imgurl=http ... CFsQrQMwEw)

PS. Ich wäre nicht ganz undankbar, wenn Ihr bei Euren Erklärungen davon ausgeht, dass ich ein Idiot bin.

Dann wärest Du hier eher falsch.

Mit freundlichen Grüßen

P.

PewPew · von **PewPew** » Do 29. Jan 2015, 12:06

Vielen Dank erstmal!

PonderStibbons hat geschrieben:Die Normalverteilung von Variablen ist nie eine notwendige
Bedingung für Tests im allgemeinen linearen Modell. Allenfalls
die Verteilung der Vorhersagefehler (Rediduen). Bei n > 50
können die aber auch einer nicht-normalen Population stammen.

Hättest Du dafür vielleicht eine Quelle? Wie gesagt, ich habe das (bzw. meine falsche Vorstellung davon, was es bedeutet) mehrmals gelesen, aber bisher keine wissenschaftlich zitierbare Begründung dafür gefunden.

PonderStibbons hat geschrieben:Du hast aber jetzt weitere Prädiktoren im Modell. Der Effekt von IV kann nur noch interpretiert werden, wenn man daran denkt, wie gleichzeitig die beiden anderen Prädiktoren auf die AV wirken. Die IV ist ja auch quasi jetzt zweimal in der Gleichung, einmal für sich, einmal eingeflossen in die Interaktion. Das sehr hohe Gewicht der Interaktion verändert markant das Gewicht von IV-alleine in der Gleichung. Ich vermute, dass im Effekt die Werte für AV mit steigendem IV ebenfalls ansteigen (weil IV in der hochgewichtigen Interaktion steckt), dass dieser Anstieg aber für hohe Werte von M steiler ist.

Okay, wenn ich das richtig verstehe ist das Problem die Interaktion zwischen den verschiedenen UVs? Könnte ich das Problem lösen, indem ich statt einer Regressions-Analyse mit 3 UVs jeweils eine getrennt mache? Also eine Regression für Kundenbindung + Involvement, einmal für Kundenbindung + Mod-Support-Bewertung und einmal für Kundenbindung + Interaktionsvariable MSxIV?

In der Regressions-Analayse korrelieren IV und die AV (Kundenbindung) übrigens nur sehr geringfügig (0,137), die Interaktionsvariable MSxIV mit der AV stärker (0,279); MS korreliert mit der AV fast gleich stark (0,242). Würde das meine Interpretation, die ich im ersten Post auch geäußert hatte, bestätigen? IV hat einen (sehr geringfügigen) Moderatoreffekt auf den Zusammenhang zwischen MS und der AV (KB)? Und die teilweise negativen BETA-Werte sind quasi nicht relevant, weil verfälscht durch die anderen UVs?

PonderStibbons hat geschrieben:Dann wärest Du hier eher falsch.

Idiot wäre vielleicht das falsche Wort. Ich bin in der Thematik einfach noch nicht so tief eingearbeitet wie die meisten heir vermutlich, deshalb habe ich manchmal Probleme, das statistische Vokabular vollständig nachzuvollziehen.

PonderStibbons · von **PonderStibbons** » Do 29. Jan 2015, 12:22

wenn ich das richtig verstehe ist das Problem die Interaktion zwischen den verschiedenen UVs?

Inwiefern Problem? Die hast Du aus theoretischen Gründen eingebracht, und
tatsächlich gibt es einen Interaktionseffekt. Die Interpretation der Koeffizienten
wird halt etwas komplexer dadurch.

Man kann sich auch ein 2 Werte für IV (hoch-niedrig) und M (hoch-niedrig)
nehmen, die entsprechenden Werte für IV*M ausrechnen, das ganze in die
Regressionsgleichung einsetzen und die Resultate für AV ausrechnen. Damit
ist es dann möglich ein Diagramm für AV in Abhängigkeit von IV zu zeichnen,
einmal eine Linie im Fall hoher Werte von M, einmal eine Linie im Falle
niedriger Werte von M.

Könnte ich das Problem lösen, indem ich statt einer Regressions-Analyse mit 3 UVs jeweils eine getrennt mache? Also eine Regression für Kundenbindung + Involvement, einmal für Kundenbindung + Mod-Support-Bewertung und einmal für Kundenbindung + Interaktionsvariable MSxIV?

Nein, das ist unsinnig.

Mit freundlichen Grüßen

P.

PewPew · von **PewPew** » Do 29. Jan 2015, 14:18

PonderStibbons hat geschrieben:Inwiefern Problem? Die hast Du aus theoretischen Gründen eingebracht, und tatsächlich gibt es einen Interaktionseffekt. Die Interpretation der Koeffizienten wird halt etwas komplexer dadurch.

Es ist für mich ein Problem, weil mich die Interpretation überfordert.

Ich habe mich bezüglich negativer Beta-Werte nochmal belesen und bin dabei auf die Möglichkeit gestoßen, die UVs vorher zu mittelwertzentrieren; das erscheint mir auch sinnvoll, weil meine Werte (als Likert-Skalen) eigentlich nicht sinnvoll 0 annehmen können. Ist das korrekt und vertretbar? Der R² ändert sich dadurch kaum (0,102 -> 0,103), nur die BETA-Werte sind jetzt alle positiv (MS 0,199; IV 0,72 [n.s.]; MSxIV 0,192). Also MS und IV mittelwertzentriert, multipliziert zum Interaktionsterm, anschließend Regression mit KB als AV und den mittelwertzentrierten UVs MS + IV sowie dem daraus berechneten Interaktionsterm MSxIV.

Wäre die korrekte Interpretation hier: "Es besteht ein positiver (Beta = 0,199) signifikanter (p = 0,003) Zusammenhang zwischen der UV MS (Bewertung des Mod-Supports) und der AV KB_X (Kundenbindungsfaktor "X"). Dieser Zusammenhang wird nicht moderiert durch Moderatorvariable IV (Involvement), da kein signifikanter (p = 0,273) Zusammenhang zu KB_X besteht. Der positive (Beta = 0,192), signifikante (p = 0,003) Zusammenhang zwischen der Interaktionsvariablen MSxIV und KB_X kann allein durch MS erklärt werden." Oder sowas in der Art?

Möglicherweise bin ich logisch wieder mal auf dem falschen Weg; für mich würde ein Moderationseffekt durch IV bestehen, wenn der Zusammenhang zwischen MSxIV und KB_X sich deutlich von dem Zusammenhang der UV MS und AV KB_X unterscheidet - ist das so korrekt? Hier sind die Werte quasi identisch: 0,199 für die UV MS allein und 0,192 für die Interaktionsvariable MSxIV. Für mich wirkt es so, als würde das Involvement keinerlei Erklärungsbeitrag leisten, also auch keinen Einfluss auf den Zusammenhang haben.

Vielen Dank nochmal; kann mir vorstellen, dass es auf Dauer anstrengend ist, das (wahrscheinlich) Offensichtliche zu erklären.

Mit freundlichen Grüßen,
Pew

PonderStibbons · von **PonderStibbons** » Do 29. Jan 2015, 14:50

Wäre die korrekte Interpretation hier: "Es besteht ein positiver (Beta = 0,199) signifikanter (p = 0,003) Zusammenhang zwischen der UV MS (Bewertung des Mod-Supports) und der AV KB_X (Kundenbindungsfaktor "X"). Dieser Zusammenhang wird nicht moderiert durch Moderatorvariable IV (Involvement),

Ach so, M steht gar nicht für Moderator, sondern für Mod-Support und IV nicht für Independent Variable
sondern Involvement.

da kein signifikanter (p = 0,273) Zusammenhang zu KB_X besteht. Der positive (Beta = 0,192), signifikante (p = 0,003) Zusammenhang zwischen der Interaktionsvariablen MSxIV und KB_X kann allein durch MS erklärt werden." Oder sowas in der Art?

Ich weiß leider nicht, worauf Du hinaus willst.

Möglicherweise bin ich logisch wieder mal auf dem falschen Weg; für mich würde ein Moderationseffekt durch IV bestehen, wenn der Zusammenhang zwischen MSxIV und KB_X sich deutlich von dem Zusammenhang der UV MS und AV KB_X unterscheidet - ist das so korrekt?

Nicht, dass ich wüsste. Die Interaktion repräsentiert hier
den Moderatoreffekt und verändert ja auch die Koeffizienten
der beteiligten Variablen. Dass da irgendwas größer oder
deutlicher als anderes sein muss, wäre mir nicht bekannt.

Vielen Dank nochmal; kann mir vorstellen, dass es auf Dauer anstrengend ist, das (wahrscheinlich) Offensichtliche zu erklären.

Da ist gar nichts offensichtlich, weil es sich um konditionale Effekte handelt.
Das beta Deiner unabhängigen Variable ist deren Effekt an der
Stelle, wo der Moderator = 0 ist (insofern war es für die Interpretation
auch sinnvoll, zu zentrieren).
regressionanalyse-f11/interpretation-interaktion-moderierte-regression-t2455.html
regressionanalyse-f11/interpretation-interaktion-moderierte-regression-t4638.html
regressionanalyse-f11/interpretation-einer-interaktion-der-multiplen-regression-t2306.html

Mit freundlichen Grüßen

P.

PewPew · von **PewPew** » Do 29. Jan 2015, 15:13

PonderStibbons hat geschrieben:Ach so, M steht gar nicht für Moderator, sondern für Mod-Support und IV nicht für Independent Variable sondern Involvement.

Ahm ... ja. Sorry, dass es da zu Verwirrungen gekommen ist.

PonderStibbons hat geschrieben:Ich weiß leider nicht, worauf Du hinaus willst.

Das macht Sinn, da Du im Folgenden die Annahme, auf der diese Interpretation beruhte, ja als falsch festgestellt hast:

PonderStibbons hat geschrieben:Nicht, dass ich wüsste. Die Interaktion repräsentiert hier den Moderatoreffekt und verändert ja auch die Koeffizienten der beteiligten Variablen. Dass da irgendwas größer oder deutlicher als anderes sein muss, wäre mir nicht bekannt.

Das heißt also, dass ich erst einmal sagen kann, dass ein Moderatoreffekt besteht, weil der Interaktionsterm MSxIV einen signifikanten Zusammenhang zeigt? Damit würde ich die Nullhypothese erst einmal verwerfen.
Die einzige Frage wäre noch, wie genau der aussieht und das ließe sich wahrscheinlich am besten grafisch zeigen; hab' ich das diesmal richtig verstanden?

LG
Pew

PS. Bei der Regression mit Mittelwertzentrierung: Nutze ich die mittelwertzentrierten Variablen nur zum Errechnen des Interaktionsterms MSxIV und setze bei der Regression die nicht zentrierten UVs ein, oder nutze ich auch die zentrierten UVs (so dass also alle Daten mittelwertzentriert sind, außer der AV).

PonderStibbons · von **PonderStibbons** » Do 29. Jan 2015, 16:14

Die einzige Frage wäre noch, wie genau der aussieht und das ließe sich wahrscheinlich am besten grafisch zeigen;

Das kann durchaus der Interpretation entscheidend dienlich sein.

LG

wtf

PS. Bei der Regression mit Mittelwertzentrierung: Nutze ich die mittelwertzentrierten Variablen nur zum Errechnen des Interaktionsterms MSxIV und setze bei der Regression die nicht zentrierten UVs ein, oder nutze ich auch die zentrierten UVs (so dass also alle Daten mittelwertzentriert sind, außer der AV).

Es ist unbedingt erforderlich, dass es übereinstimmt.

Mit freundlichen Grüßen

P.

PewPew · von **PewPew** » Do 29. Jan 2015, 16:49

PonderStibbons hat geschrieben:wtf

Lol

Vielen Dank nochmal. Ich habe fast das Gefühl, als könnte ich meine Ergebnisse nun halbwegs vernünftig interpretieren.
Sieht allerdings so aus, als müsste ich meine Moderator-Hypothesen weitgehend verwerfen. Nur zwei von zehn haben signifikante Beta-Koeffizienten.

Wahrscheinlich nicht ganz überraschend bei meiner mangelnden Übung/Erfahrung.

STATISTIK-FORUM.de

Prüfung von Moderatorhypothesen durch Lineare Regression

Prüfung von Moderatorhypothesen durch Lineare Regression

Re: Prüfung von Moderatorhypothesen durch Lineare Regression

Re: Prüfung von Moderatorhypothesen durch Lineare Regression

Re: Prüfung von Moderatorhypothesen durch Lineare Regression

Re: Prüfung von Moderatorhypothesen durch Lineare Regression

Re: Prüfung von Moderatorhypothesen durch Lineare Regression

Re: Prüfung von Moderatorhypothesen durch Lineare Regression

Re: Prüfung von Moderatorhypothesen durch Lineare Regression

Re: Prüfung von Moderatorhypothesen durch Lineare Regression

Wer ist online?