Gruppenunterschiede/-vergleich

Fragen, die sich auf kein spezielles Verfahren beziehen.

Gruppenunterschiede/-vergleich

Beitragvon AntonNicolasSmith » So 29. Okt 2023, 14:23

Hallo Community,

ich habe eine Stichprobe vorliegen, die ich in unterschiedliche Gruppen unterteilen und dann miteinander vergleichen möchte. Noch ist mir unklar, welches Verfahren dazu am besten geeignet ist.

Es handelt sich bei den Daten um eine lange Liste an Städten mit bestimmten Kennzahlen, bspw. wirtschaftliche Leistung, Zahl der Arbeitslosen etc. Ich möchte nun zeigen, dass sich diese Kennzahlen bspw. in Bayern besser entwickelt haben als in Nordrhein-Westfalen. Das kann ich mit Hilfe von Mittelwerten und Medianen über die Summe aller Städte je Bundesland und je Jahr tun, aber wie kann ich prüfen, ob die Unterschiede zwischen den Bundesländern statistisch signifikant sind?

Grüße
Anton
AntonNicolasSmith
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 28. Okt 2023, 15:21
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Gruppenunterschiede/-vergleich

Beitragvon PonderStibbons » So 29. Okt 2023, 16:05

Was heißt "besser entwickelt"? Du hast Kennzahlen aus verschiedenen Jahren, die Du verwenden willst?

Und wie stellst Du die Vergleichbarkeit sicher, musst Du nicht Merkmale wie "Größe der Stadt", "Einzugsgebiet",
"Verkehrsanbindung", "Anteil sekundärer und tertiärer Sektor an der Wertschöpfung" oder was auch immer
einbeziehen?

Wie viele Städte sind es denn in den beiden Bundesländern?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11264
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

Re: Gruppenunterschiede/-vergleich

Beitragvon AntonNicolasSmith » So 29. Okt 2023, 16:59

Bleiben wir der Einfachheit halber bei dem Beispiel Arbeitslosigkeit. Dieser ist "besser", wenn geringer. Ich ziehe über alle Jahre je Bundesland einen Mittelwert über die Arbeitslosigkeit in Prozent an der Bevölkerung in dem jeweiligen Bundesland. Nun liegt dieser Prozentwert in Bayern bspw. bei 3 %, in NRW bei 5 %. Wie kann ich prüfen, ob sich diese Werte signifikant voneinander unterscheiden? Oder wie kann ich den Unterschied von 2 % anderweitig prüfen?

Vergleichbarkeit: Arbeitslosigkeit ist ein relativer Wert, dadurch grundsätzlich vergleichbar. Andere Faktoren wie die von dir genannten Sektoren beeinflussen natürlich die Arbeitslosigkeit, sind aber für meine Anforderung nicht entscheidend.
AntonNicolasSmith
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 28. Okt 2023, 15:21
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Gruppenunterschiede/-vergleich

Beitragvon bele » So 29. Okt 2023, 17:08

Hallo Anton,

das ist verwirrend. Im Eingangspost fragst Du, wie sich die Arbeitslosenquote entwickelt hat. Für das "Entwickeln" brauchst Du mindestens zwei Messzeitpunkte und in der Folge eine Differenz zwischen beiden in beiden Bundesländern. Dein zweiter Post klingt so als wolltest Du jeweils einen Wert pro Land, also 3% mit 5% auf statistische Signifikanz prüfen. Beides sind zwei verschiedene Aufgaben.
Bitte kläre das.

Wenn letzteres die Aufgabe ist: Du kannst nicht Prozentsätze gegeneinander Testen, sondern musst erst die absoluten Zahlen (wieviele der bayerischen Bürger waren arbeitslos, wieviele nicht arbeitslos, wieviele jeweils in NRW). Dann machst Du einen Chiquadrat-Test und der wird dann ziemlich sicher signifikant.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5779
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1357 mal in 1344 Posts

Re: Gruppenunterschiede/-vergleich

Beitragvon PonderStibbons » So 29. Okt 2023, 20:23

AntonNicolasSmith hat geschrieben:Bleiben wir der Einfachheit halber bei dem Beispiel Arbeitslosigkeit. Dieser ist "besser", wenn geringer. Ich ziehe über alle Jahre je Bundesland einen Mittelwert über die Arbeitslosigkeit in Prozent an der Bevölkerung in dem jeweiligen Bundesland. Nun liegt dieser Prozentwert in Bayern bspw. bei 3 %, in NRW bei 5 %. Wie kann ich prüfen, ob sich diese Werte signifikant voneinander unterscheiden? Oder wie kann ich den Unterschied von 2 % anderweitig prüfen?

Vergleichbarkeit: Arbeitslosigkeit ist ein relativer Wert, dadurch grundsätzlich vergleichbar. Andere Faktoren wie die von dir genannten Sektoren beeinflussen natürlich die Arbeitslosigkeit, sind aber für meine Anforderung nicht entscheidend.

Ich weiß nicht, ob Dir die genaue Bedeutung von inferenzstatistischer Signifikanz klar ist.
Die ist auch 80-90% der sie berichtenden Wissenschaftler nicht klar. Es bedeutet nicht
wichtig groß relevant. Sondern nur, dass eine Aussage über die Grundgesamtheit (die
Nullhypothese) verworfen wird, die hier wohl sowas wäre wie: "in der Grundgesamheit,
aus der die Daten stammen, ist die Arbeitslosenquote von NRW EXAKT GLEICH der
Arbeitslosenquote Bayerns". Wer sollte bezweifeln, dass die Daten gegen diese
Hypothese sprechen.

Allerdings weiß ich nicht, was die Beobachtungseinheit sein soll bzw.. worin die
Stichprobe besteht. Initial war von einer großen Zahl Städte die Rede. Jetzt ist es nur
noch Bundesland A und Bundesland B. Also n=2. Damit kann man keine Tests rechnen.

Wieso willst Du nicht einfach bei der Aussage bleiben, dass in den großen Bundeland
Bayern mit Millionen Einwohnern 3% beobachtet wurde, bei den Millionen NRW'lern 5%?
Wo ist da eine inferenzstatistische Fragestellung, auf welche Grundgesamtheit willst
Du schließen? Zumal die Stichprobenfehler angesichts Millionen Beobachtungseinheiten
als Datenbasis quasi 0 sind. Da gibt es eigentlich nichts zu testen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11264
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

Re: Gruppenunterschiede/-vergleich

Beitragvon AntonNicolasSmith » Sa 4. Nov 2023, 16:44

Erstmal vielen Dank für eure Hilfe!

Der Begriff "Entwicklung" war unbeabsichtigt irreführend, sorry. Ich habe den Begriff intuitiv verwendet, weil ich Daten mehrerer Jahre vorliegen habe.

Nullhypothese (Arbeitslosigkeit überall gleich) mag in diesem Beispiel nicht zutreffen bzw. realistisch erscheinen, bei weiteren Kennzahlen jedoch schon.

Zur Stichprobengröße kann ich sagen, dass es sich um mehrere tausend Datensätze handelt. Mein Beispiel war nur vereinfachend gemeint.

Ein Chiquadrat-Test wurde mir von einem Kollegen auch empfohlen. Mir liegen aber zur Arbeitslosigkeit und weiteren Kennzahlen nur die Prozentwerte vor. Kann man diese irgendwie anders gegeneinander testen?
AntonNicolasSmith
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 28. Okt 2023, 15:21
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Gruppenunterschiede/-vergleich

Beitragvon PonderStibbons » Sa 4. Nov 2023, 17:15

Warum und wozu wollst Du irgendwelche Twests rechnen statt die Daten einfach ordentlich deskriptiv auszuwerten?
Welches ist Deine Beobachtungseinheit, "Bundesland" (n=2? n=16?). Städte/Kreise (n=???) ? "Mehrere Tausend Datensätze"
ist leider keine nachvollziehbare Beschreibung der Datenlage und worin die Beobachtungseinheit besteht.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11264
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

Re: Gruppenunterschiede/-vergleich

Beitragvon AntonNicolasSmith » Sa 4. Nov 2023, 17:49

Bild
AntonNicolasSmith
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 28. Okt 2023, 15:21
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Gruppenunterschiede/-vergleich

Beitragvon PonderStibbons » Sa 4. Nov 2023, 19:48

Du hast 12.000 Städte aus 16 Bundesländern? Wie kommt das zustande, gibt es so viele Städte in Deutschland?

Du nun willst vergleichen, ob die Quoten bei den Städten aus NRW im Durchschnitt (und/oder im Mittel?) anders sind als die aus Bayern?
Ohne strukturelle Unterschiede zu berücksichtigen wie Größe, Verkehrsanbindung, Lage usw.

Frage erneut, wozu ein statistischer Test, den Vergleich kann man doch problemlos ohne Inferenzstatistik durchführen?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11264
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2474 mal in 2458 Posts

Re: Gruppenunterschiede/-vergleich

Beitragvon AntonNicolasSmith » So 5. Nov 2023, 11:48

PonderStibbons hat geschrieben:Du hast 12.000 Städte aus 16 Bundesländern?

Ja.

PonderStibbons hat geschrieben:Wie kommt das zustande, gibt es so viele Städte in Deutschland?

Ja.

PonderStibbons hat geschrieben:Du nun willst vergleichen, ob die Quoten bei den Städten aus NRW im Durchschnitt (und/oder im Mittel?) anders sind als die aus Bayern?

Ja.

PonderStibbons hat geschrieben:Ohne strukturelle Unterschiede zu berücksichtigen wie Größe, Verkehrsanbindung, Lage usw.

Ja.

PonderStibbons hat geschrieben:Frage erneut, wozu ein statistischer Test, den Vergleich kann man doch problemlos ohne Inferenzstatistik durchführen?

Die Aufgabe ist vorgegeben und die Idee dahinter ist, Aussagen über die Grundgesamtheit treffen zu können.
AntonNicolasSmith
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 28. Okt 2023, 15:21
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste