Vergleich von der Verteilung verschiedener Personengruppen

Vergleich von der Verteilung verschiedener Personengruppen

Beitragvon Thretcha » Fr 22. Okt 2021, 18:20

In meiner Bachelorarbeit beschäftige ich mich mit Hybriden Unternehmertum und subjective norms die die Entscheidung hybrider Unternehmer zu werden beeinflussen. Das Ganze baut auf der „Theorie von planned behavior“. Sprich es geht darum wie die Meinung von Personen, die einem nahe stehen diese Entscheidung beeinflussen. Um das zu messen, fragt man wie verschiedene Personengruppen dazu stehen und wie wahrscheinlich man nach deren Meinung handelt. Beides wird auf einer (likert) rating skala von 1-7(ordinal) gemessen von unwahrscheinlich bis wahrscheinlich. Den Faktor subjektive Norm erhält man durch die Multiplikationen dieser beiden Faktoren miteinander. Dadurch bekommt man einen Wert zwischen 1-49 pro Befragten pro Personengruppe.

Ich möchte jetzt überprüfen ob die verschiedenen Personengruppen (Eltern, Freunde, Arbeitskollegen, Familie, …) unterschiedlich verteilte Subjektive Normen haben und dadurch sich statistisch unterscheiden. Dafür habe ich den chi squared test als passend identifziert (mann whitney u ist laut Literatur auch geeignet). Dafür will ich sowohl die einzelnen Faktoren als auch das Ergebnis der einzelnen Multiplikationen miteinander vergleichen. Ich wollte jedoch bevor ich einen Fragebogen aussende, erstmal mit Testaten simulieren und bin auf Probleme gestoßen.

Bei meinen simulierten Daten sehe ich zwar grafisch schöne Unterschiede jedoch bekomme ich keine sinnvollen Ergebnisse bei statistischen Berechnungen in SPSS raus. Jetzt Zweifel ich, ob ich nicht irgendwas grundsätzlich falsch mache bzw. falsch verstanden habe. Muss ich etwa zum Beispiel die Daten noch vorher gruppieren, um weniger unterschiedliche Werte zu haben also in (1-7; 8-14; 15-21; 22-28; 29-35; 36-42; 43-49). Oder gar die Anzahl an Personengruppen stark eingrenzen da ich ja jede Personengruppe mit jeder anderen einzeln vergleichen müsste. Idealer weiße würde ich natürlich noch für Geschlecht kontrollieren. Ich gehe von einem relativen kleinen Sample aus sprich wahrscheinlich so 20-25.

Ich hoffe ich hab das ganze relativ kurz und klar rübergebracht.
Bereits jetzt danke dafür dass ihr euch die Zeit genommen habt meinen Post zu lesen.

Bild
Bild
Bild
Bild
Zuletzt geändert von Thretcha am Sa 23. Okt 2021, 23:34, insgesamt 1-mal geändert.
Thretcha
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 22. Okt 2021, 17:23
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Vergleich von der Verteilung verschiedener Personengrupp

Beitragvon bele » Fr 22. Okt 2021, 20:07

Hi!

Erstmal Glückwunsch zu der Entscheidung, diese Fragen vor der Datenerhebung zu Stellen. Das ist überdurchschnittlich vernünftig. Aber willst wirklich 7 Gruppen mit insgesamt 20 bis 25 Beobachtungen vergleichen?

LG, Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5905
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1393 mal in 1379 Posts

Re: Vergleich von der Verteilung verschiedener Personengrupp

Beitragvon Thretcha » Fr 22. Okt 2021, 21:01

hallo und danke für die rasche Antwort.

Bezüglich der Personengruppen kann ich es relativ gut argumentieren nur Familie, Freunde, Arbeitskollegen zu verwenden.
Wenn es um die Gruppierung vom Faktor subjektive Normen geht, ist das natürlich ein gutes Argument, dass es bei einer Stichprobe von 20-25 nicht Sinn macht diese auf sieben Gruppen zu unterteilen.
Da das im Schnitt nur 2.86 tatsächliche Werte pro Gruppe zu erwarten wären.
Diesbezüglich würde ich gefühlsmäßig die Grenzen bei 3-5 Gruppen setzen, da zumindest "niedrig" "mittel" und "hoch" zu unterscheiden Sinn machen würde.
Thretcha
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 22. Okt 2021, 17:23
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Vergleich von der Verteilung verschiedener Personengrupp

Beitragvon bele » Sa 23. Okt 2021, 12:49

Hallo!

Thretcha hat geschrieben:Beides wird auf einer (likert) rating skala von 1-7(ordinal) gemessen von unwahrscheinlich bis wahrscheinlich. Den Faktor subjektive Norm erhält man durch die Motivation dieser beiden Faktoren miteinander.


So kann man das nicht sagen. In dem Moment, wo Du Deine rating scale als ordinal beurteilst kannst Du damit keine Multiplikation mehr durchführen. Du wirst Sie daher von vorneherein als quasi-metrisch betrachten müssen.

Ich möchte jetzt überprüfen ob die verschiedenen Personengruppen (Eltern, Freunde, Arbeitskollegen, Familie, …) unterschiedlich verteilte Subjektive Normen haben und dadurch sich statistisch unterscheiden. Dafür habe ich den chi squared test als passend identifziert


Der Chi-Quadrat test ist hier nicht passend. Du versuchst ihn passend zu machen, indem Du nachher Deine Gruppierung in "in (1-7; 8-14; 15-21; 22-28; 29-35; 36-42; 43-49)" vornimmst. Aber die Zahl der Kästchen in Deiner Kontingenztabelle ist die Zahl der Personengruppen mal die Zahl der Wertegruppen und da bist Du mit Deinen 20 bis 25 Beobachtungen auf verlorenem Posten.

Wie oben geschrieben erhälst Du durch die Multiplikation metrische Werte und zum Vergleichen metrischer Werte in verschiedenen Grupppen ist der von Dir bereits herausgesuchte Mann-Whitney-U-Test, auch nur dann geeignet, wenn Du Dich auf paarweise Gruppenvergleiche beschränkst. Schau Dir mal den Kruskal-Wallis-Test an.

Diesbezüglich würde ich gefühlsmäßig die Grenzen bei 3-5 Gruppen setze

Das ist selbst bei drei Gruppen wenig und wird nur sehr deutliche Unterschiede detektieren. Du solltest Dir sehr ernsthafte Gedanken machen, ob Du die Zahl der zu beobachtenden Einheiten nicht doch noch steigern könntest. Nur eins ist in der Statistik besser als große Stichproben: Nohch größere Stichproben.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5905
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1393 mal in 1379 Posts

Re: Vergleich von der Verteilung verschiedener Personengrupp

Beitragvon Thretcha » Sa 23. Okt 2021, 23:33

Hallo!

bele hat geschrieben: ... Aber die Zahl der Kästchen in Deiner Kontingenztabelle ist die Zahl der Personengruppen mal die Zahl der Wertegruppen und da bist Du mit Deinen 20 bis 25 Beobachtungen auf verlorenem Posten.

Ok ja, sehe jetzt wo mein Fehler liegt. Ich habe nicht genauer darüber nachgedacht, wie Chi Squared konkret funktioniert. Sprich da er nur vergleicht wie oft ähnliche Werte vorkommen, macht es natürlich wenig Sinn sehr viele Werte zu haben die nicht einmal alle einmal vorkommen in der Stichprobe.
Natürlich werde ich versuchen eine möglichst große Stichprobe zu erhalten, ist aber logischer weiße nicht 100% in meiner Kontrolle wie viele dann tatsächlich bei der Umfrage teilnehmen.
Meine derzeitige Definition der Stichprobe inkludiert potentiell ein paar hundert Personen.

Bezüglich der ordinal/quasi-metrisch Betrachtung, macht es durchaus Sinn, da ohne diese Annahme ja statistisch gesehen die vorgenommenen Tests nicht erlaubt/möglich wären.
Scheint auch in anderen Studien die diese Theorie benutzen so gehandhabt geworden zu sein.
Meine ursprüngliche Annahme hatte ich einfach vom Autor abgeleitet, der diese Theorie etabliert hat, dieser empfiehlt bipolar adjective scales als erhebungsform und die definiert die Berechnung durch die Multiplikation.
Natürlich sagt dieser nie ob es ordinal oder quasi-metrisch etc. ist und ich habe daher diese Lücke unbewusst falsch gefüllt, ohne darüber nachzudenken.

Ich habe den Kruskal-Wallis-Test (den ich noch nicht kannte) sowie den Mann-Whitney U Test jetzt in SPSS durchgeführt.
Sieht auf den ersten Blick sehr vielversprechend aus.
Was mir aufgefallen ist, dass wenn ich die Daten gruppiere in "niedrig, mittel, hoch" das Ergebnis sehr ähnlich ist als wie, wenn ich das nicht tue.
Nach meinem Verständnis vom Kruskal-Wallis-Test muss ich auch hier die Gruppierung vornehmen da sonst wie beim Chi Squared Test die Anzahl an Vergleichen eskaliert.
Oder ist gerade das der Grund wieso der Kruskal-Wallis-Test hier geeignet ist und der Chi Squared Test nicht, weil man ihn ohne diese gruppierung durchführen kann?
Des Weiteren würde ich wahrscheinlich sofern der Kruskal-Wallis-Test signifikant ist, Mann-Whitney U Tests für sämtliche Kombinationen durchführen, um die einzelnen signifikanten Unterschiede festzustellen.
Da der Kruskal-Wallis-Test ja nur eine Gesamtbetrachtung liefert, welche als Ausgangspunkt durchaus sehr viel Sinn macht.

Habe ich keine sehr hohe Stichprobe muss ich wahrscheinlich auch auf Kontrollvariablen verzichten.
Denn, wenn ich für Geschlecht kontrolliere, würde dass die Anzahl an Tests verdoppeln und die Stichprobe für die Tests jeweils circa halbieren.

Kruskal-Wallis-Test gruppiert [niedrig, mittel, hoch]:
Bild

Kruskal-Wallis-Test ungrupiert:
Bild

Mann-Whitney U Test:
Bild
Thretcha
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 22. Okt 2021, 17:23
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Vergleich von der Verteilung verschiedener Personengrupp

Beitragvon bele » So 24. Okt 2021, 12:50

Hallo!

Thretcha hat geschrieben:Meine derzeitige Definition der Stichprobe inkludiert potentiell ein paar hundert Personen.


Das würde halt die Tür in die Welt der linearen Regression / ANOVA aufstoßen, wenn Du an große Zahlen kommst und das wäre hilfreich.

Oder ist gerade das der Grund wieso der Kruskal-Wallis-Test hier geeignet ist und der Chi Squared Test nicht, weil man ihn ohne diese gruppierung durchführen kann?


Genau das war der Gedanke dahinter.

Habe ich keine sehr hohe Stichprobe muss ich wahrscheinlich auch auf Kontrollvariablen verzichten.
Denn, wenn ich für Geschlecht kontrolliere, würde dass die Anzahl an Tests verdoppeln und die Stichprobe für die Tests jeweils circa halbieren.


Da es um die Beeinflussung von Meinung geht könnte ich mir vorstellen, dass Geschlecht durchaus wichtig ist. Im Rahmen einer linearen Regression/AnOVa/ANCoVa (kurz:lineares Model) könnte man die Einflussgröße von Geschlecht über alle Gruppen hinweg als gemeinsamen Wert untersuchen und damit Freiheitsgrade sparen. Da gilt halt immer die Annahme linearer Zusammenhänge und die Normalverteilungsannahme für Residuen, beides ist mit wachsender Stichprobengröße entspannter zu sehen. Deshalb solltest Du lineare Modelle meiden, wenn Du nur wenig Beobachtungen und wenige Einflussfaktoren hast, je mehr Beobachtungen und je mehr Druck zur Beachtung von Kovariaten umso eher kommst Du zum linearen Modell.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5905
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1393 mal in 1379 Posts

folgende User möchten sich bei bele bedanken:
Thretcha


Zurück zu Kreuztabellen & Chi²

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste