Odds Ratio - Signifikanz in sehr großen Stichproben

Odds Ratio - Signifikanz in sehr großen Stichproben

Beitragvon Kaisito » Do 7. Sep 2017, 17:36

Hallo allerseits, vielleicht könnt ihr mir ja weiterhelfen:)

Folgendes: ich habe eine Zufallsstichprobe von circa 7000 Krankheitsfälle, aus einer Gesamtheit von circa 112000 Krankheitsfällen in der Population.

Ich möchte die Odds Ratio für die Altersgruppen in der Population berechnen. Die absoluten Häufigkeiten für die einzelnen Altersgruppen in der Population liegen mir vor.

Ich habe die 7000 Krankheitsfälle (zu jedem liegt mir das Alter vor) auf die Gesamtheit der Krankheitsfälle mit dem entsprechenden Hochrechnugnsfaktor (16) hochgerechnet. Dann habe ich die Odds Ratio, anhand der hochgerechneten Häufigkeiten der Erkankungen in den bestimmten Altersgruppen und anhand der absoluten Häufigkeiten in den jewweilgen Alterskategorien der Population, berechnet.

Problem: Da die Stichprobe so natürlich sehr groß ist werden Unterschiede, die dem Augenschein nach (bzw. bei Begutachtung der relativen Häufigkeiten) sehr gering sind hochsignifikant. Wenn ich meine 7000 Krankheitsfälle nicht hochrechne, dafür aber die Population durch den Hochrechnungsfaktor teile, erhalte ich die selben Odds Ratios mit signifikanten/nicht signifikanten Unterschieden, welche meine Hypothesen weitgehend entsprechen;).

Ist einer von den beiden Wegen nicht zulässig? Und wenn ja, warum?

Wäre super wenn ihr mir helfen könntet.

LG von Kai
Kaisito
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Mi 7. Jun 2017, 10:07
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Odds Ratio - Signifikanz in sehr großen Stichproben

Beitragvon PonderStibbons » Do 7. Sep 2017, 17:49

Vielleicht beschäftigst Du Dich zunächst damit, welche Frage ein Signifikanztest behandelt und was ein p-Wert besagt und vor allem, was "(nicht) signifikant" denn konkret bedeutet. Sobald z.B. klar geworden ist, dass ein Begriff wie "hochsignifikant" wenig Sinn ergibt, könnte es sein, dass sich die Fragen zum Teil von selber beantworten. Ansonsten dann nochmal fragen.

Allerdings ist mit unbekannt, wieso man seine Stichprobe ohne Weiteres mit 16 malnehmen dürfte.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

Re: Odds Ratio - Signifikanz in sehr großen Stichproben

Beitragvon Kaisito » Do 7. Sep 2017, 18:12

Vielen Dank für die schnelle Antwort.

Mit hochsignifikant meinte ich lediglich, dass ich anstatt einem Sternchen zwei Sternchen dran machen könnte...

Nun ich bin der Meinung das Konzept der Signifikanz in seinen Grundzügen verstanden zu haben... bei p = 0,05 würde mein Odds Ratio mit einem Konfidenzintervall das nicht 0 enthält in 95 Fällen von 100 Simulationen der Berechnung innerhalb dieses Konfidenzintervalls liegen - nicht 0 sein - signifikant sein...

?
Kaisito
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Mi 7. Jun 2017, 10:07
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Odds Ratio - Signifikanz in sehr großen Stichproben

Beitragvon PonderStibbons » Do 7. Sep 2017, 18:23

Mit hochsignifikant meinte ich lediglich, dass ich anstatt einem Sternchen zwei Sternchen dran machen könnte...

Ja, eben. Es wäre stattdessen vorteilhaft, in die Materie ein wenig einzusteigen.
Nun ich bin der Meinung das Konzept der Signifikanz in seinen Grundzügen verstanden zu haben... bei p = 0,05 würde mein Odds Ratio mit einem Konfidenzintervall das nicht 0 enthält in 95 Fällen von 100 Simulationen der Berechnung innerhalb dieses Konfidenzintervalls liegen - nicht 0 sein - signifikant sein...

Bei Odds ratios ist H0, dass OR=1. Aber davon ab, der springende Punkt ist, dass es sich um Inferenzstatistik handelt. Es geht um Schlussfolgerungen von Stichprobendaten auf die Verhältnisse in Populationen. Und hinsichtlich der Population hat man eine Punkthypothese, hier wie gesagt: OR=1,0000000...00000000000000... . Um die zu widerlegen, braucht man nur eine genügend große Stichprobe. Kein Grund zur Verwirrung, wie mir scheint. "Signifikant" ist dabei leider ein schlimm irreführendes Wort, sogar Fisher selber hat bedauert, es eingeführt zu haben, wenn ich mich recht entsinne.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

Re: Odds Ratio - Signifikanz in sehr großen Stichproben

Beitragvon Kaisito » Do 7. Sep 2017, 18:51

In meinem Fall ist es nun ja so, dass exakt bekannt ist (natürlich ausgenommen, nicht berichtete Fälle) wie viele Ereignisse in der Population stattgefunden haben. DIe absolute Zahl der Ereignisse ist bekannt (circa 112000) aufgrund des Codirungsaufwandes wurde aber nur eine Stichprobe mit circa 7000 Fällen codiert(ein Datensatz zur Auswertung erzeugt), für die dann eben der Hochrechnungsfaktor (16) berichtet wurde.

Ziel ist es somit nicht die Anzahl der Ereignisse in der Popolation zu schätzen. Ziel ist es Unterschiede zwischen bestimmten Gruppen innerhalb der Population zu beschreiben. ich habe da dann halt auch Hypothesen abgeleitet a la "das Erkrankungsrisiko ist in Altersgruppe A größer als in Gruppe B" und als Statistik-Noob dachte ich mir ich könnte diese Hypothese anhand eines Konfidenzintervalls testen...

Vielleicht bringt sie mein Unverständnis ja nicht komplett auf die Palme und ich krieg einen Hiwneis ob ich unter diesen bedingungen meine Population "runterbrechen" darf oder ob die Stichprobe hochzurechnen ist... ;)
Kaisito
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Mi 7. Jun 2017, 10:07
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Odds Ratio - Signifikanz in sehr großen Stichproben

Beitragvon PonderStibbons » Fr 8. Sep 2017, 08:56

Ziel ist es Unterschiede zwischen bestimmten Gruppen innerhalb der Population zu beschreiben.

Wenn die 112.000 keine Stichprobe darstellen bzw, nicht als solche behandelt wird, sondern es um ihre Deskription geht, dann sind alle inferenzstatistischen Tests der berechneten Parameter (wie OR) ja überflüssig und Du kannst diesen Auswertungsschritt einsparen.
ch habe da dann halt auch Hypothesen abgeleitet a la "das Erkrankungsrisiko ist in Altersgruppe A größer als in Gruppe B" und als Statistik-Noob dachte ich mir ich könnte diese Hypothese anhand eines Konfidenzintervalls testen...

Wozu? Das siehst Du an der OR. Erst wenn Du die 112.000 als Stichprobe aus einer Population betrachtest, werden solche Rechnungen sinnvoll. Wenn die betrachteten Teilgruppen in die Tausende gehen, sind die Standardfehler ohnedies so klein, das man auch direkt die Parameter interpretieren kann.

Mit freundlichen GRüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts


Zurück zu Kreuztabellen & Chi²

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste