Seite 1 von 1

Welches Verfahren statistische Signifikanz?

BeitragVerfasst: Di 4. Aug 2020, 15:22
von flokan
Hallo zusammen,

ich möchte gerne wissen welcher Test für mein Problem in Frage kommt. Ich habe schon intensiv im Internet und in der Fachliteratur nach einer geeigneten Methode gesucht, konnte bisher habe keine Lösung finden.

Folgendes Problem:

Ich arbeite neben dem Studium in einem Medizintechnikunternehmen und möchte überprüfen, ob die Häufigkeiten der Reklamationen statistisch signifikant steigen.
D.h. ich habe als Grundgesamtheit meine verkauften Produkte. Von 2010 bis 2018 waren das ca. 40.000 Stück, davon wurden 400 Stück im Jahr 2018 reklamiert (also 400 Stück). (Da es sich um implantierbare Produkte handelt, ist es egal ob das reklamierte Produkt 2010, 2014 oder 2018 verkauft wurde). Der Kunde hat bei uns immer die Möglichkeit das Produkt zu reklamieren (egal wie alt es ist). Daraus folgt, dass 1% (also 400 Stück) aller im Markt befindlicher Produkte (40.000 Stück) im Jahr 2018 reklamiert wurden.
Nun möchte ich vergleichen, ob sich die Reklamationshäufigkeit in 2019 signifikant verändert hat. Von 2010 bis 2019 wurden nun ca. 50.000 Stück verkauft und 520 Produkte reklamiert. Das sind dann 1,04% reklamierte Produkte.

Ich muss noch erwähnen, dass die reklamierten Produkte nur diese sind, von denen wir auch wissen. D.h. wenn ein Arzt ein Implantat explantiert und uns nicht einschickt, dann erfahren wir davon in der Regel auch nicht. D.h. die Zahl der reklamierten Produkte könnte theoretisch höher sein.

Ok, ich möchte nun prüfen ob die Häufigkeit der Reklamationen aus 2019 (520 Stück, 1,04%) gegenüber 2018 (400 Stück, 1%) signifkant gestiegen sind? Auf dem ersten Blick sehe ich natürlich, dass sie um 0,04% gestiegen sind, die Frage ist nur, ob das auch statistisch signifikant ist? Welcher Test würde für dieses Problem in Frage kommen?

Für Antworten und Hilfe eurerseits wäre ich sehr dankbar!

Liebe Grüße!

Re: Welches Verfahren statistische Signifikanz?

BeitragVerfasst: Di 4. Aug 2020, 15:56
von bele
Nun, man muss sich überlegen, wie mutig man seine Annahmen machen möchte. Wenn beispielsweise 2017 gelegentlich Kekse statt Titan verarbeitet wurden, dann sind diese Implantate alle in 2018 schon gebrochen und wurden reklamiert, sodass die Keksimplantate bei den 2019ern gar nicht mehr im Topf sind. Aber fangen wir mit schlichter Statistik an: Wir stellen eine Vier-Felder-Tafel auf, wieviele Exemplare in einem Jahr verkauft und reklamiert und wieviele verkauft und nicht reklamiert waren:

Code: Alles auswählen
implant <- matrix(c(400, 400000 - 400, 520, 500000 - 520), nrow = 2)
rownames(implant) = c("reklamiert", "nicht")
colnames(implant) = c("2018", "2019")
print(implant)

ergibt
Code: Alles auswählen
> print(implant)
             2018   2019
reklamiert    400    520
nicht      399600 499480


Damit rechnen wir jetzt einen Chiquadrat-Unabhängigkeitstest:

Code: Alles auswählen
> chisq.test(implant)

   Pearson's Chi-squared test with Yates' continuity
   correction

data:  implant
X-squared = 0.31011, df = 1, p-value = 0.5776


mit p = 0,58 verfehlt der Test die Signifikanz mit weitem Abstand, man kann also nicht sagen, in welchem Jahr die wahre Reklamationsrate höher war.

LG,
Bernhard

Re: Welches Verfahren statistische Signifikanz?

BeitragVerfasst: So 18. Okt 2020, 00:22
von tomm
Du musst den p Wert berechnen. Ist der niedriger als alpha=0.05, dann ist die Anstieg signifikant.

Ich denke allerdings, dass du bei deinem Test andere Variablen außen vor lässt, die auch Einfluss auf Reklamationen in den jeweiligen Jahren haben. Auch ist es nicht ausreichend nur zwei Jahre zu betrachten, wenn du den Anstieg auf die Signifikanz überprüfen möchtest