STATISTIK-FORUM.de

magu · von **magu** » Sa 16. Mär 2024, 21:27

Hallo zusammen,

im Rahmen meiner Masterarbeit führe ich zum ersten Mal eine eigene statistische Analyse durch und habe Schwierigkeiten bei der Interpretation. In meiner Hypothese vermute ich einen umgekehrt u-förmigen Zusammenhang zwischen dem Anteil an Telearbeit und der Absicht im Unternehmen zu verbleiben. Um diesen Zusammenhang zu prüfen, habe ich eine hierarchische multiple lineare Regression durchgeführt. Im ersten Schritt habe ich lediglich die UV Anteil Telearbeit aufgenommen, im zweiten Schritt zusätzlich Anteil Telearbeit² und im dritten Schritt habe ich noch Kontrollvariablen hinzugefügt.
Im dritten Modell ist der Regressionskoeffizient B für Anteil Telearbeit bei -0,014 und ß=-0,301 und für Anteil Telearbeit² B=0,000 (Standardfehler = 0) und ß=0,371. Wie wäre insbesondere der Wert B=0 im Hinblick auf die Hypothese zu interpretieren?
Der p-Wert für Anteil Telearbeit² liegt in diesem Modell exakt bei 0,1. Bei meiner Recherche habe ich beim Signifikanzniveau sowohl gelesen, dass der p-Wert kleiner gleich als auch nur kleiner dem Signifikanzniveau sein muss. Wäre mein Ergebnis auch wenn sehr schwach noch auf dem 10%-Niveau signifikant oder knapp daran vorbei?

Vielen Dank im Voraus und liebe Grüße

bele · von **bele** » Sa 16. Mär 2024, 22:34

magu hat geschrieben:In meiner Hypothese vermute ich einen umgekehrt u-förmigen Zusammenhang [...]
für Anteil Telearbeit² B=0,000 (Standardfehler = 0) und ß=0,371. Wie wäre insbesondere der Wert B=0 im Hinblick auf die Hypothese zu interpretieren?

Ein Koeffizient von Null zeigt an, dass die Daten Deine Hypothese mit U-förmigem Zusammenhang nicht stützen. Andererseits glaube ich, dass Beta (also ß) in SPSS den standardisierten Korrelationskoeffizienten beschreibt. Wenn der nicht auch Null ist, vielleicht ist der Koeffizient gar nicht wirklich Null, sondern nur sehr klein, weil Telearbeit² sehr große Werte annimmt? Nachkommastellen?

Der p-Wert für Anteil Telearbeit² liegt in diesem Modell exakt bei 0,1.

Unwahrscheinlich. Kann man davon nicht auch weitere Nachkommastellen anzeigen lassen? In jedem Fall ist es noch auf dem 50%-Niveau signifikant. Mal ehrlich, wen interessiert schon ein 10%-Signifikanzniveau Üblicherweise sind 5% das Maß der Dinge.

LG,
Bernhard

folgende User möchten sich bei bele bedanken:
magu

magu · von **magu** » So 17. Mär 2024, 00:32

Hallo Bernhard,

vielen Dank für die schnelle Antwort!

vielleicht ist der Koeffizient gar nicht wirklich Null, sondern nur sehr klein, weil Telearbeit² sehr große Werte annimmt? Nachkommastellen?

Der exakte Wert bei Telearbeit² für B beträgt 0,000171025747135.

Ich habe als erstes ein Streudiagramm erstellt und es war kein konkreter Zusammenhang zwischen Anteil Telearbeit und der Bleibeabsicht erkennbar eher eine Gerade. Bei der Loess Kurve ist eine wirklich sehr minimale S-Form erkennbar. Ich habe in einem ersten Schritt einen Kruskal-Wallis-Test mit drei Ausprägungen für Telearbeit gering, mittel und hoch durchgeführt mit dem Ergebnis, dass es keine statistisch signifikanten Unterschiede zwischen den Gruppen hinsichtlich der Bleibeabsicht gibt. Anschließend nun die Regression mit zusätzlichen Kontrollvariablen.

Modell 1
Anteil Telearbeit B=0,001, ß=0,027, p=0,725
mit R=0,027, R²=0,001, Adj. R²=-0,005

Modell 2
Anteil Telearbeit B=0,003, ß=0,059, p=0,840
Anteil Telearbeit B=0,001, ß=-0,000015328346613, p=0,910
mit R²=0,001, Adj. R²=-0,011

-> somit eigentlich keine Veränderung zwischen den beiden Modellen und insgesamt schlechtes Modell zur Vorhersage der abhängigen Variable

Modell 3
Anteil Telearbeit B=-0,014, ß=0,010, p=0,177
Anteil Telearbeit B=0,000171025747135, ß=0,371, p=0,0,099684216899238
mit R²=0,487, Adj. R²=-0,447

N=167

-> Insgesamt deutliche Verbesserung des Modells bei Hinzunahme von Kontrollvariablen

Zum Signifikanzniveau habe ich ebenfalls 5% als gängiges Maximum gelesen, allerdings wird bei an meinem Lehrstuhl ebenfalls das 10% Niveau betrachtet, dieses ist auch in der Formatvorlage unter den Tabellen aufgeführt.

Wie wäre dies nun insgesamt zu interpretieren? Bedeutet dies, dass der Anteil Telearbeit insgesamt kein guter Prädikator für die Absicht im Unternehmen zu verbleiben ist und andere Variablen betrachtet werden sollten? Könnte man evtl. trotzdem daraus schlussfolgern, welche der beiden Variablen besser ist? Im dritten Modell hat ja Telearbeit² einen besseren p-Wert (falls tatsächlich wie beim Lehrstuhl gängig noch auf dem 10% Niveau signifikant), allerdings weiß ich nicht, wie der sehr geringe Koeffizient B zu interpretieren ist. Wäre es bei der Verschriftlichung hier vielleicht sinnvoller ß zu interpretieren?

Vielleicht könntest Du mir, falls möglich zusätzlich kurz erklären, wie allgemein der Koeffizient einer UV² zu interpretieren ist, da ich mich bei dieser Variable sehr schwer tue. Wenn es ja tatsächlich eine U-Form gibt, müsste es ja einen Punkt geben, bei dem der Regressionskoeffizient vom positiven ins negative geht oder andersherum, es gibt aber ja immer nur entweder einen positiven oder negativen Wert.

Ganz lieben Dank für die Hilfe und viele Grüße

bele · von **bele** » So 17. Mär 2024, 10:24

Hallo,

es sieht ein wenig unseriös aus, wenn man den p-Wert mit sovielen Nachkommastellen angibt

Anteil Telearbeit B=0,000171025747135, ß=0,371, p=0,0,099684216899238

aber es beantwortet Deine Frage von weiter oben, ob der p-Wert < 0,10 ist. Jawohl ist er.

Zum Signifikanzniveau habe ich ebenfalls 5% als gängiges Maximum gelesen, allerdings wird bei an meinem Lehrstuhl ebenfalls das 10% Niveau betrachtet

Das tut mir Leid. In dem Fall hast Du Deine Theorie vom umgekehrt U-förmigen Zusammenhang leider signifikant widerlegt. Für einen umgekehrt U-förmigen Zusammenhang müsste der Koeffizient des quadratischen Terms ein negatives Vorzeichen haben. Deiner hat ein signifikant positives Vorzeichen. Damit ist die Theorie empirisch widerlegt.

Bedeutet dies, dass der Anteil Telearbeit insgesamt kein guter Prädikator für die Absicht im Unternehmen zu verbleiben ist und andere Variablen betrachtet werden sollten?

Das wird wohl so sein. Berechne nochmal das Modell mit nur den Koviariaten ohne Telearbeit und dann noch einmal mit Telearbeit und vergleiche das R² miteinander - dann siehst Du, wieviel Varianzaufklärung allein mit Telearbeit gelingt.

Könnte man evtl. trotzdem daraus schlussfolgern, welche der beiden Variablen besser ist?

Das dürfte nicht die Fragestellung sein. Telearbeit ist immer noch nur eine Größe, auch wenn sie im Modell sowohl einfach als auch quadratisch vorkommt. Die Kombination beider Terme erlaubt es, einen leicht kurvigen, z. B. auch nicht-monotonen, Verlauf zu modellieren. "Besser" ist zwischen Telearbeit und Telearbeit² eigentlich keine Denkkategorie.

Wenn es ja tatsächlich eine U-Form gibt, müsste es ja einen Punkt geben, bei dem der Regressionskoeffizient vom positiven ins negative geht oder andersherum

Ich bin nicht sicher, ob ich die Frage richtig verstanden habe. Anscheinend willst Du besser verstehen, wie die Auswirkungen von Telearbeit sind. Dazu solltest Du Dir einen Funktionsgraphen von $f(x) = 0,000171025747135\cdot x^2 - 0,014\cdot x$ zeichnen und vielleicht hilft auch ein wenig Kurvendiskussion dazu machen.

Mit SPSS kenne ich mich nicht aus, ich nutze R. Wenn SPSS das nicht sehr leicht macht, dann installiere Dir R und kopiere

Code: Alles auswählen: curve(0.000171025747135*x^2 - 0.014*x, from=0, to = 80)

dort hinein, dann siehst Du eine Parabel, U-förmig, mit einem Minimum bei nicht ganz 41.

Genauer sagt es uns die Kurvendiskussion: Die Ableitung von 0.000171025747135*x^2 - 0.014*x ist 2*0.000171025747135*x - 0.014. Die Nullstelle davon ist x0 = 40.93. Das ist das Minimum von f(x).

Für die Interpretation Deiner Kurve sollte man wissen, ob Telearbeit Werte um 41 annehmen kann, oder nicht. Wenn das innerhalb der Range von Telearbeit ist, dann ist das der Kippunkt, ab dem die Bleibewahrscheinlichkeit im Modell wieder zunimmt. Wenn das außerhalb der Range ist, dann hast Du keinen U-förmigen Zusammenhang sondern einfach nur eine etwas krumm gebogene Gerade. Auf der y-Achse des Funktionsgraphen kann man abschätzen, wie groß oder klein der Einfluss von Telearbeit ist.

Wenn das nicht die Frage war, gerne nochmal nachfragen.

LG,
Bernhard

PS: Wenn der Funktionsgraph es in die Arbeit schaffen sollte, kann man den natürlich visuell noch etwas aufhübschen, etwa so (einfach in die R-Konsole copypasten):

Code: Alles auswählen: curve(0.000171025747135*x^2 - 0.014*x, from=0, to = 100, ylab = expression(0.000171*x^2 - 0.014*x), xlab = "x (Anteil Telearbeit in %)") abline(0, 0, lty = 3) abline(v = 40.92951, col = "grey") axis(3, 40.9)

folgende User möchten sich bei bele bedanken:
magu

magu · von **magu** » Mo 18. Mär 2024, 09:48

Hallo Bernhard,

vielen Dank für Deine ausführliche Antwort und Deine Mühe mit der Darstellung der Funktion.

Dann muss ich nun schauen, wie ich mit diesen Ergebnissen weiter fortfahre und argumentiere.

Liebe Grüße

M.

bele · von **bele** » Mo 18. Mär 2024, 13:55

Freut mich, wenn es hilft. An Deiner Stelle würde ich mir nochmal ein Streudiagramm machen lassen mit der Telearbeit auf der x-Achse und den Residuen von Bleibebereitschaft aus der Regression mit den Kovariaten aber ohne Teilzeit als UV. Die Wirklichkeit ist kein lineares Modell und Probanden sind nicht i.i.d.
Vielleicht hast Du eine Gruppe von Praktikanten, die alle Null Telearbeit bekommen und alle versichern, dass sie 100% Bereitschaft zum bleiben haben. Sowas kann das das Modell in eine U-Form zwingen, selbst wenn ohne die die umgekehrte U-Form richtig gewesen wäre. Plotten und Anschauen ist da durch nichts zu ersetzen.

Viel Erfolg,
Bernhard

STATISTIK-FORUM.de

Lineare Regression: Regressionskoeffizient interpretieren

Lineare Regression: Regressionskoeffizient interpretieren

Re: Lineare Regression: Regressionskoeffizient interpretiere

Re: Lineare Regression: Regressionskoeffizient interpretiere

Re: Lineare Regression: Regressionskoeffizient interpretiere

Re: Lineare Regression: Regressionskoeffizient interpretiere

Re: Lineare Regression: Regressionskoeffizient interpretiere

Wer ist online?