Aussagekräftige Datenmenge

Fragen, die sich auf kein spezielles Verfahren beziehen.

Aussagekräftige Datenmenge

Beitragvon Lila Margareta » Mi 5. Dez 2018, 19:59

Hi Ihr!

Ich habe die Zahl der erfolgreich abgeschlossenen Promotionen für alle Studiengänge aus dem letzten Jahr in Deutschland. Ich habe pro Studiengang jeweils die Gesamtzahl aller Absolventen und dann nochmal für jeden Studiengang aufgeschlüsselt, wie viele der Absolvierenden männlich und wie viele weiblich waren.

Jetzt ist es natürlich so, dass in einigen Fächern sehr viele Leute ihre Promotion abschließen, das sind in einigen Studiengängen mehrere 100. In anderen Studiengängen haben im letzten Jahr aber nur 40 oder sogar nur 6 Leute die Promotion abgeschlossen.

Für mich ist die Verteilung der männlichen und weiblichen Absolvierenden sehr wichtig. Wenn aber im Jahr 2017 nur insgesamt 6 Leute in einem Studiengang eine Promotion gemacht haben, dann könnte diese Verteilung, bspw. 5 Frauen, 1 Mann, ja völlig zufällig sein.

Meine Frage ist also: Wie groß muss die Zahl der Absolventen insgesamt sein, damit ich davon ausgehen kann, dass die Verteilung der Männer und Frauen in einem Studiengang aussagekräftig und nicht nur eine zufällige Verteilung ist?

Vielen Dank schon mal im Voraus! :)

Liebe Grüße
Lila
Lila Margareta
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 5. Dez 2018, 19:31
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Aussagekräftige Datenmenge

Beitragvon strukturmarionette » Mi 5. Dez 2018, 23:42

Hi,

wenn nur 6 existieren, stellt sich keine Frage nach Zufälligkeit.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4312
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 582 mal in 579 Posts

Re: Aussagekräftige Datenmenge

Beitragvon Lila Margareta » Do 6. Dez 2018, 01:32

Hi S.,

das mit den 6 war nur ein Beispiel. Meine Frage ist eigentlich, bei welcher Menge an Absolventen ich einen Studiengang ausschließen muss. Dass ich ihn ausschließe bei nur 6 Leuten ist mir schon klar. Aber schließe ich auch Studiengänge aus, bei denen nur 20 Leute absolviert haben oder auch noch Studiengänge, bei denen nur 40 Leute absolviert haben? Oder darf ich überhaupt nur Studiengänge ab 100 Absolventen reinnehmen, weil die Frauen/Männer-Verteilung erst ab 100 Personen überzufällig ist? Dieser Wert, wo ich den Schnitt mache, reinnehmen oder nicht, den suche ich. :)

Liebe Grüße
Lila
Lila Margareta
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 5. Dez 2018, 19:31
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Aussagekräftige Datenmenge

Beitragvon strukturmarionette » Do 6. Dez 2018, 03:37

Hi,

ob eine Verteilung zufällig zustande gekommen ist oder nicht, könnte ein Siginikanztest feststellen.
Es gilt immer: Je größer die Stichprobe, desto besser.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4312
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 582 mal in 579 Posts

Re: Aussagekräftige Datenmenge

Beitragvon PonderStibbons » Do 6. Dez 2018, 10:14

Für eine aussagekräftige statistische Testung brauchst Du ca. n=190 pro Studiengang,
wenn der interessierende Geschlechtereffekt mittelgroß ist (Binomialtest; ein Männeranteil
oder Frauenanteil von 40% in der Grundgesamtheit; power 0,80; alpha 0,05). Bei einem
angenommenen großen Effekt in der Grundgesamtheit (z.B. Männeranteil 30%) wären
es ca. n=50.

Du kannst Deine Ergebnisse auch mal über einen Bayes-Rechner laufen lassen, der
Dir ermittelt, wie groß der Vertrauensbereich für die jeweiligen Anteile ist. Für
eine kleine Stichprobe (#Examined =30) und einen großen Effekt (#successes
z.B. Männer n=10, also Anteil 0,33) wäre das ein 90%-Vertrauensbereich [Confidence]
von 0,2 bis 0,47. https://www.causascientia.org/math_stat ... ionCI.html

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2466 mal in 2450 Posts

Re: Aussagekräftige Datenmenge

Beitragvon Lila Margareta » Fr 14. Dez 2018, 16:11

Hallo PonderStibbons,

vielen Dank für deine Antwort! Du hast mir sehr weitergeholfen. Mein Eindruck ist, dass ich durchaus auf dem richtigen Weg bin mit dem Bayes-Rechner und dem Binomialtest. Ich habe mich informiert und ein bisschen gerechnet. Ich habe aber noch einige Fragen.
Beim Binomialtest braucht es ja immer eine theoretische oder empirische Wahrscheinlichkeit, die man schon kennt. Das macht ja auch viel Sinn. Aber wenn ich hierfür eine Wahrscheinlichkeit wie z. B. aus einer Statistik mit sehr großer Teilnehmerzahl nehme, dann stehe ich ja wieder vor meiner ursprünglichen Frage: Wie viele Leute muss diese große Statistik haben, damit ich ihr vertrauen kann? Es muss doch irgendeine Art von Deckelwert geben, ab wann ein n groß genug ist, dass man damit aussagekräftige Berechnungen anstellen kann.
Du sagst jetzt n=190 bzw. n=50 ist eine Mindestzahl für eine aussagekräftige Studie. Ist das eine allgemeine Annahme unter Statistikern oder hast du das berechnet? Wie hast du das berechnet? Wie du siehst tappe ich wirklich im Dunkeln :/
In Bezug auf den Bayes-Rechner (super Sache :D) frage ich mich 2 Dinge. Wenn ich einen beobachteten Wert/success von k=10 habe (wie in deinem Bsp.) und mein KI liegt dann zwischen 0,2 bis 0,47, kann ich das dann interpretieren als zu kleine SP, da mein beobachteter Wert k=10 nicht im KI auftaucht (also dass das KI einen Wert k zwischen 20 und 47 erwartet?)?
Und dann frage ich mich, wann mein KI klein genug ist. Ist das einfach mein persönlicher Geschmack?

Liebe Grüße
Lila
Lila Margareta
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 5. Dez 2018, 19:31
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Aussagekräftige Datenmenge

Beitragvon strukturmarionette » Fr 14. Dez 2018, 18:12

Hi,

Ist das einfach mein persönlicher Geschmack?

- Ja und der persönliche Geschmack der Abnehmerschaft Deines Tuns.

Aber schließe ich auch Studiengänge aus, bei denen nur 20 Leute absolviert haben oder auch noch Studiengänge, bei denen nur 40 Leute absolviert haben?

- Du musst nichts ausschließen, nur immer das N mitangeben.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4312
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 582 mal in 579 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast