STATISTIK-FORUM.de

Faktenbasiert · von **Faktenbasiert** » Do 23. Mär 2023, 15:20

Guten Tag

Ich schildere hier ein fiktives Beispiel, und würde mich sehr über eine einfache Antwort freuen.

In Deutschland leben 82 Millionen Menschen. Durchschnittlich 4 Prozent von diesen haben rote Haare.

Von diesem 82 Millionen Menschen sind 42 000 Menschen Journalisten.

Wieviele von diesen Journalisten muss ich bezüglich des Merkmals "Haarfarbe" untersuchen, um am Ende zuverlässig
sagen zu können, dass das Merkmal "rote Haare" bei Journalisten häufiger, seltener, oder gleich wahrscheinlich vorkommt,
wie im Durchschnitt bei der Gesamtbevölkerung Deutschlands (82 Millionen)?

Viele Grüße!

PonderStibbons · von **PonderStibbons** » Do 23. Mär 2023, 16:10

In Deutschland leben 82 Millionen Menschen. Durchschnittlich 4 Prozent von diesen haben rote Haare.

Wieso durchschnittlich?

Wieviele von diesen Journalisten muss ich bezüglich des Merkmals "Haarfarbe" untersuchen, um am Ende zuverlässig
sagen zu können, dass das Merkmal "rote Haare" bei Journalisten häufiger, seltener, oder gleich wahrscheinlich vorkommt,
wie im Durchschnitt bei der Gesamtbevölkerung Deutschlands (82 Millionen)?

Für "gleich wahrscheinlich" kannst Du das hier benutzen https://select-statistics.co.uk/calcula ... roportion/
Da gibst Du ein, wie groß Deine Population (hier die Journalisten) ist;
wie groß der Anteil ist, den Du überprüfen willst (likely sample proportion, hier 4%),;
wie genau die Schätzung sein soll (margin of error, z.B. plus/minus 0.5% oder plus/minus 1% oder plus/minus 0.1%);
und wie zuverlässig die Schätzung sein soll (95% ist voreingestellt, gängig sind auch 90% oder 99%).

Auf dieser Basis bekommst Du dann eine Schätzung der erforderlichen Fallzahl.

Mit freundlichen Grüßen

PonderStibbons

Faktenbasiert · von **Faktenbasiert** » Do 23. Mär 2023, 17:27

Vielen Dank,

jedoch verwirrt mich das. Warum sinkt die erforderliche Fallzahl, wenn der erwartbare Anteil der Rothaarigen in der Gesamtpopulation sinkt? Wenn ich zB. 1 Prozent eingebe (angenommem, nur einer von 100 Menschen hat rote Haare), sagt der Rechner ich bräuchte nur 16 Journalisten? Wie soll ich denn da eine verlässliche Überprüfung machen, wenn nur 1 von 100 Journalisten erwartbar rote Haare hat? Anders gesagt, je kleiner der zu erwartbare Zeil von Rothaarigen an der Population ist, desto größer müsste doch eigentlich die Zahl der Journalisten sein, die ich überprüfen muss?

Faktenbasiert · von **Faktenbasiert** » Do 23. Mär 2023, 17:35

PonderStibbons hat geschrieben:
In Deutschland leben 82 Millionen Menschen. Durchschnittlich 4 Prozent von diesen haben rote Haare.

Wieso durchschnittlich?

Wieviele von diesen Journalisten muss ich bezüglich des Merkmals "Haarfarbe" untersuchen, um am Ende zuverlässig
sagen zu können, dass das Merkmal "rote Haare" bei Journalisten häufiger, seltener, oder gleich wahrscheinlich vorkommt,
wie im Durchschnitt bei der Gesamtbevölkerung Deutschlands (82 Millionen)?

Für "gleich wahrscheinlich" kannst Du das hier benutzen https://select-statistics.co.uk/calcula ... roportion/
Da gibst Du ein, wie groß Deine Population (hier die Journalisten) ist;
wie groß der Anteil ist, den Du überprüfen willst (likely sample proportion, hier 4%),;
wie genau die Schätzung sein soll (margin of error, z.B. plus/minus 0.5% oder plus/minus 1% oder plus/minus 0.1%);
und wie zuverlässig die Schätzung sein soll (95% ist voreingestellt, gängig sind auch 90% oder 99%).

Auf dieser Basis bekommst Du dann eine Schätzung der erforderlichen Fallzahl.

Mit freundlichen Grüßen

PonderStibbons

Oder muss der "Margin of error"- Wert proprtional zu dem "What do you believe the likely sample proportion to be?"- Wert sinken, dass heisst bei 50 Prozent Rothaarigen reicht 5 Prozent margin of error, bei 4 Prozent Rothaarigen bräuchte ich 0,4 Prozent margin of error?

PonderStibbons · von **PonderStibbons** » Do 23. Mär 2023, 18:22

Faktenbasiert hat geschrieben: Warum sinkt die erforderliche Fallzahl, wenn der erwartbare Anteil der Rothaarigen in der Gesamtpopulation sinkt? Wenn ich zB. 1 Prozent eingebe (angenommem, nur einer von 100 Menschen hat rote Haare), sagt der Rechner ich bräuchte nur 16 Journalisten?

Die Frage, ob die Stichprobe aus einer 1%-Grundgesamtheit stammt, kann man ab "2 von 16
Untersuchten waren Rothaarig" verneinen (Binomialtest). In solchen Randbereichen sind die
gängigen Formeln aber nicht so zuverlässig, wie es aussieht.

Will man insbesondere wissen, ob der Anteil eventuell kleiner ist als 1%, müsste man natürlich
von einer weitaus größeren Stichprobe ausgehen. Beispielsweise, wenn Du 1% als zu testenden Wert
ansetzt und willst mit 95% Sicherheit bestimmen, ob der tatsächliche Anteil außerhalb der Grenzen
[0,5%;1.5%] liegt, brauchst Du laut dem verlinkten Rechner 1500 Fälle. Leuchtet ja auch ein,
anders kann man nicht Prozentzahlen unter 1% sinnvoll berechnen.

Mit freundlichen Grüßen

PonderStibbons

Faktenbasiert · von **Faktenbasiert** » Do 23. Mär 2023, 19:09

Ok, welchen "margin of error"- Wert sollte ich bezüglich meiner Ausgangsfragestellung (4 Prozent Rothaarige) wählen, um eine ausreichend große Stichprobe für ein aussagekräftiges Ergebnis zu bekommen?

PonderStibbons · von **PonderStibbons** » Do 23. Mär 2023, 20:17

Das ist doch allein Deine Sache, mit welcher Fehlertoleranz Du arbeiten willst.
Hängt von der Fragestellung und Kosten- Nutzen-Überlegungen ab.

Mit freundlichen Grüßen

PonderStibbons

Faktenbasiert · von **Faktenbasiert** » Do 23. Mär 2023, 20:31

OK ich konkretisiere es etwas:

Angenommen ich gehe davon aus, dass unter den 42 000 Journalisten in Deutschland mehr Rothaarige vorkommen, als in der Gesamtbevölkerung Deutschlands (4 Prozent), welche Werte bezüglich des von dir verlinkten Kalkulators muss ich jeweils in diesen eingeben, um eine ausreichend große Stichprobengröße zu haben, um am Ende "wissenschaftlich fundiert" sagen zu können: "Ja, bei der Gruppe "Journalisten in Deutschland" kommt das Merkmal "rote Haare" häufiger vor, als bei der Gesamtbevölkerung, oder nein, bei Journalisten in Deutschland gibt es genauso viele Rothaarige, wie in der Gesamtbevölkerung?

PonderStibbons · von **PonderStibbons** » Do 23. Mär 2023, 22:21

Deine Frage war, wie man zuverlässig sagen kann, ob das Merkmal häufiger/gleich/seltener vorkommt.
Welche Einstellungen man bei den entsprechenden Berechnungen vornehmen kann und dass es bei einer Grundrate
von 1% einen erheblichen Unterschied ergibt, ob man nur "ungleich" oder eventuell "kleiner als" herausfinden will,
haben wir diskutiert. Welche Fehlertoleranz Du nun akzeptieren willst, ist Deine Entscheidung. Eventuell hängt es
auch vom Gegenstandsbereich und dessen Konventionen ab; in der Genetik sind das sicher andere als bei Wahlumfragen
usw. Da es ein fiktives Beispiel ist, lohnt es sich leider nicht für mich, mir weiter den Kopf darüber zu zerbrechen.

Mit freundlichen Grüßen

PonderStibbons

Faktenbasiert · von **Faktenbasiert** » Do 23. Mär 2023, 22:59

Vielen Dank für deine Mühe,

ich dachte halt, dass es irgendwie eine einfache Antwort gibt, jetzt bezogen auf dieses Beispiel konkret mit den roten Haaren, zB.: "500 Journalisten sollte man schon diesbezüglich untersuchen", so grob in dem Dreh, damit ich eine Orientierung habe...

Ich kenn mich halt mit Statistik leider nicht aus...

Aber dann habe ich es richtig verstanden, dass die Fehlertoleranz unabhängig von diesen "4 Prozent" ist, also das egal ob 4 Prozent oder 50 Prozent von allen Menschen rote Haare hätten, die zu wählende Fehlertoleranz, um die Stichprobengröße für die Journalisten zu errechnen, nicht damit zusammenhängt, um ein aussagekräftiges Ergebnis zu bekommen?

Viele Grüße

STATISTIK-FORUM.de

Fiktives Beispiel

Fiktives Beispiel

Re: Fiktives Beispiel

Re: Fiktives Beispiel

Re: Fiktives Beispiel

Re: Fiktives Beispiel

Re: Fiktives Beispiel

Re: Fiktives Beispiel

Re: Fiktives Beispiel

Re: Fiktives Beispiel

Re: Fiktives Beispiel

Wer ist online?