Welches Verfahren ist das richtige?

Fragen, die sich auf kein spezielles Verfahren beziehen.

Welches Verfahren ist das richtige?

Beitragvon PeterM » Sa 6. Okt 2018, 23:31

Hallo,

ich habe eine kurze Frage und würde mich freuen, wenn mir jemand einen Tipp geben könnte. Ich poste mal hier in "Allgemein" da ich nicht sicher bin, ob das von mir verwendete Verfahren überhaupt passend ist.

Meine Statistik-Vorlesungen sind schon einige Zeit her und nun stehe ich vor einem kleinen Problem:

Im Rahmen einer Arbeit habe ich 4 relativ simple Werte ermittelt. Leider habe ich nun beim berechnen der Signifikanz so meine Schwierigkeiten und ich hänge fest.

Vereinfacht sieht das ganze so aus:

Bundesweit wurden 250.000 Leuten eine Frage gestellt. Davon antworteten 225.000 mit NEIN und 25.000 mit JA.

Aus diesem großen Datenbestand wurden nun die Leute extrahiert, welche die Frage nur in der Region Freiburg beantwortet haben:

Regional in Stuttgart waren es 3.000 befragte, davon antworteten 2.715 mit NEIN und 285 mit JA.

Zusammengefasst:

Bundesweit alle -> 250.000 befragt -> 225.000 NEIN -> 25.000 JA
regional Stuttgart -> 3.000 befragt -> 2.715 NEIN -> 285 JA

Im ersten Fall sagen also 10% der befragten JA und im zweiten Fall 9,5%.

Um nun herrauszustellen, dass es kein signifikanter Unterschied ist, habe ich den Chi-Quadrat-Test durchgeführt. Das Signifikanzniveau ist, wie ich schon vermutet hatte nur bei 82%, also ist in diesem Fall der Unterschied für mich nicht signifikant. Da wähnte ich mich noch in Sicherheit ;)

Jetzt kam mir aber ein Gedanke, der mich aus der Bahn geworfen hat -> Die "regional Stuttgart" Befragten sind mit Ihren Antworten ja auch in dem bundesweiten Daten mit enthalten, darf ich dann überhaupt einen chi-quadrat Test machen? Oder verfälscht das das ganze Vorhaben?

Ich habe nun lange gegoogelt und vergleichbare Beispiele gesucht, konnte aber leider nichts finden und würde mich daher sehr freuen, wenn mir jemand einen Wink in die richtige Richtung geben könnte!

Viele Grüße,
Peter
Zuletzt geändert von PeterM am Sa 6. Okt 2018, 23:50, insgesamt 1-mal geändert.
PeterM
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Sa 6. Okt 2018, 23:20
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Welches Verfahren ist das richtige?

Beitragvon PonderStibbons » Sa 6. Okt 2018, 23:47

Da mal von Freiburg und mal von Stuttgart die Rede ist, weiß ich nicht, ob ich die Frage richtig verstehe,
aber falls es darum geht, das Antwortverhalten einer Subgruppe zu charakterisieren, dann wäre die
Vergleichsgruppe um diese Subgruppe zu vermindern (225000-2215 bzw. 25000-285).

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11255
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2470 mal in 2454 Posts

folgende User möchten sich bei PonderStibbons bedanken:
PeterM

Re: Welches Verfahren ist das richtige?

Beitragvon PeterM » Sa 6. Okt 2018, 23:57

Oh, natürlich nur Stuttgart in der Frage =) Sorry für die Verwirrung (ich beantworte die Frage für viele Regionen, aber das Prinzip ist ja dann in jeder gleich).

Zu deiner Antwort: Also was du schreibst klingt gut! Das bedeutet ich ziehe die Befragten aus der Region einfach von Bundesweit ab und vergleiche dann: 225000-2215 mit 25000-285 -> cool!

Wäre dann Chi-Quadrat geeignet? (also nach der Bereinigung)
PeterM
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Sa 6. Okt 2018, 23:20
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Welches Verfahren ist das richtige?

Beitragvon PeterM » So 7. Okt 2018, 10:23

Das mit der Subgruppe ist eine super Idee, das werde ich einfließen lassen, jedoch wenn ich die Frage beantworten will "Region Stuttgart im bundesweiten Vergleich" dann müsste es ja der gesamte Bund sein. Daher die Frage ob ich generell beim vergleichen von bundesweit zu regional auch chi-quadrat nutzen kann. Oder ist er nicht geeignet, weil eben regional in bundesweit enthalten ist (oder spielt das vielleicht gar keine Rolle)?

Viele Grüße,
Peter
PeterM
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Sa 6. Okt 2018, 23:20
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Welches Verfahren ist das richtige?

Beitragvon PonderStibbons » So 7. Okt 2018, 20:13

Wie ich bereits schrieb, die Stuttgarter Fäller sind vom Rest der Bundesrepublik abzuziehen.
Dann kann das Zahlenverhältnis in der Stuttgarter Subgruppe (2715 nein versus 285 ja) mit dem
Zahlenverhältnis im Rest der Rest der Republik ([225000-2715] nein versus [25000
versus 285] ja) per Chi²-Test verglichen werden.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11255
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2470 mal in 2454 Posts

Re: Welches Verfahren ist das richtige?

Beitragvon PeterM » So 7. Okt 2018, 21:05

Hey PonderStibbons,
danke noch mal für deine Antwort. Entschuldige, aber ich glaube ich stehe auf dem Schlauch.

Dass ich die Subgruppe abziehe und dass ich dann die Signifikanz des Testes "bundesweit minus regional" gegen "nur regional" testen kann, habe ich verstanden.

Aber wenn ich nun die Aussage Treffen will " gesamt-bundesweit (mit Region Stuttgart) antorteten 11,11% mit JA im Gegensatz dazu waren es in der Region Stuttgart 10,49% -> der Unteschied ist nicht signifikant" Das wäre doch ein Test ohne die Subgruppe abzuziehen oder täusche ich mich?

Viele Grüße,
Peter
PeterM
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Sa 6. Okt 2018, 23:20
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Welches Verfahren ist das richtige?

Beitragvon PonderStibbons » So 7. Okt 2018, 22:29

Welchen Sinn soll das haben? Wäre die Frage "unterscheidet sich die ja-Quote der nicht-Stuttgarter von der ja-Quote gesamt-bundesweit", käme man auch nicht auf den Gedanken, die Substichprobe 247.000 nicht-Stuttgarter mit der Gesamtstichprobe 250.000 zu vergleichen. Wäre aber logisch nicht anders als Dein Vorgehen.

Und für den Signifikanztest Chi² ist es auch nicht zulässig, dass dieselben Leute in beiden Vergleichsgruppen sind.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11255
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2470 mal in 2454 Posts

folgende User möchten sich bei PonderStibbons bedanken:
PeterM

Re: Welches Verfahren ist das richtige?

Beitragvon PeterM » So 7. Okt 2018, 23:08

Hallo PonderStibbons,

danke für dein geduldiges Antworten. Für mich ist das Neuland.

Verstehe ich dich richtig, wenn ich es so formuliere: Der Vergleich von gesamt-bundesweit mit der Region Stuttgart macht keinen Sinn, WEIL Stuttgart ein Teil von gesamt-bundesweit ist. Wenn man überhaupt vergleicht, dann nur getrennt.

Meine Aufgabenstellung war zu vergleichen, wie sich die Region-Stuttgart im Vergleich zum gesamten Bundesgebiet verhält. Das bedeutet die Aufgabenstellung ist so einfach nicht ganz sinnvoll?
PeterM
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Sa 6. Okt 2018, 23:20
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Welches Verfahren ist das richtige?

Beitragvon PeterM » Mo 8. Okt 2018, 08:30

Sorry, dass ich so auf dem Schlauch stehe. Aber ich habe mir das nun noch mal überlegt. Arbeitslosenquoten werden doch auch so verglichen?

Also zum Beispiel "Bundesweit ist die Arbeitslosen-Quote bei 6% - in Stuttgart nur bei 5%" da würde man doch testen, ob das ein signifikanter Unterschied ist, oder? Hier würde man beim Vergleich von Bundesweit und Stuttgart doch Stuttgart auch nicht aus Bundesweit herausrechnen, oder?

Ich wollte ja die Region Stuttgart nicht mit dem Rest, sondern mit Gesamt-Deutschland vergleichen. (Und für diese beiden Zahlen dann feststellen, ob ein signifikanter Unterschied besteht.)
PeterM
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Sa 6. Okt 2018, 23:20
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Welches Verfahren ist das richtige?

Beitragvon PonderStibbons » Mo 8. Okt 2018, 09:14

Also zum Beispiel "Bundesweit ist die Arbeitslosen-Quote bei 6% - in Stuttgart nur bei 5%" da würde man doch testen, ob das ein signifikanter Unterschied ist, oder?

Nicht dass ich wüsste.
Hier würde man beim Vergleich von Bundesweit und Stuttgart doch Stuttgart auch nicht aus Bundesweit herausrechnen, oder?

Mag sein. Stimmig wäre es nicht. Man kann derselben Logik folgend auch Westdeutschland (68 Mio)
mit Gesamtdeutschland (80 Mio) vergleichen und ignorieren, dass 68 Mio in beiden Gruppen enthalten sind.

Ich wollte ja die Region Stuttgart nicht mit dem Rest, sondern mit Gesamt-Deutschland vergleichen.

Also auch mit sich selber. Wenn Du mit dieser Logik keine Probleme hast, dann sei es so.
Deskriptivstatistisch fällt das anscheinend sowieso kaum jemandem auf. Wenn es allerdings
um einen inferenzstatistischen Test geht, dann besteht das Problen in der Annahme des
Chi²-Zusammenhangstests, dass die Gruppen unabhängig, nicht-überlappend sind und dass
nicht teilweise Objekte mit sich selbst verglichen werden.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11255
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2470 mal in 2454 Posts

folgende User möchten sich bei PonderStibbons bedanken:
PeterM

Nächste

Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste

cron