STATISTIK-FORUM.de

Isbjörn · von **Isbjörn** » Mi 7. Feb 2024, 13:53

Hallo,

wir haben einen Test der als Ergebnis gut oder schlecht hat. Wir wissen aus der Natur des zu testenden Teils, dass der Test auch mal schlecht als Ergebnis liefert. Als "Laune" der Statistik ;-)

. Liefert ein Teil im ersten Test ein Ergebnis "schlecht" wird der Test noch einmal gemacht. Ein Wiederholung des Test wird allerdings ausschließlich mit Teilen gemacht die im vorhergehenden Test ein "schlecht" lieferten. Da ist der Haken an der Sache. Teile die zwei Mal ein "schlecht" geliefert haben werden mitunter auch noch ein drittes Mal getestet. Aber nicht immer.

Dazu gibt es zwei Fragestellungen:
Die Frage ist wie hoch die Wahrscheinlichkeit für diese Art von Teilen ein "gut" Ergebnis zu liefern aus der Teststichprobe?
Gibt es einen negativen oder positiven Effekt des ersten Test auf das Ergebnis des zweiten Test, bei dem nur "schlecht" Teile aus dem ersten Test verwendet werden?

Hier ein paar Zahlen (reale Zahlen):
Erster Test: 25 von 468 liefern "schlecht"
Zweiter Test mit den Teilen, die im ersten Test "schlecht" lieferten (25 Teilen): 7 liefern "schlecht" von 25 schon "schlecht" getesteten
Dritter Test mit Teilen die in den zwei Tests (Anzahl 7) vorher "schlecht" geliefert haben: 1 liefert "schlecht" aus 7 zwei Mal "schlecht" getesteten.

Der Test ist im übrigen eindeutig, die Zufallskomponente liegt rein im Teil.

Wie ist der Ansatz die beiden Fragen oben statistisch zu lösen?
Ich habe zwei Ansätze. Um nicht zu Beeinflussen (biasing) enthalte ich euch die Ansätze vorerst vor. Vielleicht habt ihr die gleichen oder ganz andere.

bele · von **bele** » Mi 7. Feb 2024, 14:36

Isbjörn hat geschrieben:Hallo,

Hallo!

Als "Laune" der Statistik

Dass Messungen fehlerbehaftet sind ist der eigentliche Grund, warum wir Statistik betreiben.

Teile die zwei Mal ein "schlecht" geliefert haben werden mitunter auch noch ein drittes Mal getestet. Aber nicht immer.

Gibt es dafür Gründe? Ist das ein Zufallsprozess? Wenigstens eine Begründung?

Dazu gibt es zwei Fragestellungen:
Die Frage ist wie hoch die Wahrscheinlichkeit für diese Art von Teilen ein "gut" Ergebnis zu liefern aus der Teststichprobe?

Erster Test: 25 von 468 liefern "schlecht"

Der Anteil der Teile die beim ersten Versuch ein schlecht liefern ist 25 von 468, d.h. 5,3% mit einem Konfidenzintervall [3,49%, 7,78%]

Über den ganzen Versuch hinweg ist ein Teil von 468 gestarteten am Ende noch schlecht. Die beste Schätzung für die Wahrscheinlichkeit ist 1/468, es sei denn wir hätten schon begründete Vorannahmen für das Ergebnis gehabt. Die sind dann hier nicht berücksichtigt.

Gibt es einen negativen oder positiven Effekt des ersten Test auf das Ergebnis des zweiten Test, bei dem nur "schlecht" Teile aus dem ersten Test verwendet werden?

Zweiter Test mit den Teilen, die im ersten Test "schlecht" lieferten (25 Teilen): 7 liefern "schlecht" von 25 schon "schlecht" getesteten

Das sind 28% mit einem Konfidenzintervall von [12,1%, 49,4%]. Die Konfidenzintervalle für die wahre Häufigkeit überlappen sich nicht, also sind das unterschiedliche Wahrscheinlichkeiten. Teile die beim ersten Mal durchgefallen sind haben ein höheres Risiko, beim zweiten Mal wieder durchzufallen.

Code: Alles auswählen: > fisher.test(matrix(c(25,7,468-25,25-7), nrow = 2)) Fisher's Exact Test for Count Data data: matrix(c(25, 7, 468 - 25, 25 - 7), nrow = 2) p-value = 0.000521 alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: 0.05198196 0.45340371

Gibt es einen negativen oder positiven Effekt des ersten Test auf das Ergebnis des zweiten Test, bei dem nur "schlecht" Teile aus dem ersten Test verwendet werden?

Um nicht zu Beeinflussen (biasing) enthalte ich euch die Ansätze vorerst vor.

Normalerweise hätte ich an dieser Stelle aufgehört weiter nachzudenken. Aber ich erinnere mich von früheren Beiträgen, dass Du ein ernsthaftes Forumsmitglied bist.

LG,
Bernhard

Isbjörn · von **Isbjörn** » Do 8. Feb 2024, 15:50

Hallo Bernhard,
Danke für deine Antwort, Anregung und gute Erklärung. Ich konnte alle Zahlen nachrechnen und habe dazu recherchiert. Zuerst allerdings die Beantwortung deiner Frage:

bele hat geschrieben: Gibt es dafür Gründe? Ist das ein Zufallsprozess? Wenigstens eine Begründung?

Ja, das ist ein Zufallsprozess. Es handelt sich physikalisch um eine Hochspannungsentladung in einem nichtleitenden Medium. Eine Entladung findet erst statt wenn eine gewisse Grundmenge an Elektronen vorhanden sind die im elektrischen Feld beschleunigt werden und dann weitere Elektronen generieren. Das führt dann zum Durchschlag. Der Durchschlag passiert meistens, aber nicht immer, da die Grundmenge an Elektronen nicht immer erreicht ist und wir diese nicht forcieren.

Ich habe in deiner Antwort zwei mögliche Herangehensweisen gesehen, die die unabhängig der beiden Zündversuche zeigen sollen. Den Konfidenzintervall Vergleich und die "Fisher exact" Methode.
1) Konfidenzintervall:
Der Clopper-Pearson Intervall wurde genutzt mit dem Konfidenzlevel 0.95 (beidseitig). Damit ist das Ergebnis, dass die Ausfallwahrscheinlichkeiten von Versuch eins und dem Wiederholversuch eindeutig unterschiedlich sind. D.h. der erste Versuch resultiert in einem höheren Ausfallwahrscheinlichkeit. Fundament für die Berechnung ist die Betaverteilung.

bele hat geschrieben:. Über den ganzen Versuch hinweg ist ein Teil von 468 gestarteten am Ende noch schlecht. Die beste Schätzung für die Wahrscheinlichkeit ist 1/468, es sei denn wir hätten schon begründete Vorannahmen für das Ergebnis gehabt. Die sind dann hier nicht berücksichtigt.

Wie kommt es zu dem einen noch schlechten Teil?

2) Fisher exact Test:
Im Vergleich der Ausfallwahrscheinlichkeiten vom ersten Test zum Wiederholtest ergibt der Test, dass die beiden Ausfallwahrscheinlichkeiten der beiden Tests abhängig sind. Ist die Aussage damit analog zu 1) nur auf einem anderen Weg erreicht? Fundament für die Berechnung ist die hypergeometrische Verteilung.

Grüße
Björn

bele · von **bele** » Do 8. Feb 2024, 17:15

Hallo Björn,

Isbjörn hat geschrieben:Wie kommt es zu dem einen noch schlechten Teil?

So habe ich es verstanden, dass Du oben geschrieben hattest:

Dritter Test mit Teilen die in den zwei Tests (Anzahl 7) vorher "schlecht" geliefert haben: 1 liefert "schlecht" aus 7 zwei Mal "schlecht" getesteten.

Ist die Aussage damit analog zu 1) nur auf einem anderen Weg erreicht?

Konfidenzintervalle haben den Vorteil, dass man sich ungefähr vorstellen kann, wie genau man die wahre Wahrscheinlichkeit bestimmt hat. Konfidenzintervalle die sich nicht überschneiden bedeuten statistische Signifikanz. Konfidenzintervalle die sich überschneiden sind aber für nichts beweiskräftig. Außerdem gibt es wohl auch verschiedene Wege, binomiale Konfidenzintervalle zu berechnen, also nicht den einen richtigen. Deshalb, und um Dir einen p-Wert zu geben, habe ich alternativ auch den Fishertest gerechnet.

LG,
Bernhard

Isbjörn · von **Isbjörn** » Do 8. Feb 2024, 17:49

bele hat geschrieben:
Dritter Test mit Teilen die in den zwei Tests (Anzahl 7) vorher "schlecht" geliefert haben: 1 liefert "schlecht" aus 7 zwei Mal "schlecht" getesteten.

d

Hier hätte ich 1 "schlechtes" auf auf 7 getestete gerechnet. Das sind dann [0.004...0.579]. Gut, damit kann man dann wohl alles oder nichts erklären.

Damit sind die beiden Fragen beantwortet.
Ich hätte einen Ansatz mit bedingten Wahrscheinlichkeiten erwartet, denn im zweiten Test werden ausschließlich schlechte Teile aus dem ersten Test verwendet. Das macht dann wohl den Unterschied.

bele · von **bele** » Do 8. Feb 2024, 18:09

Isbjörn hat geschrieben:Das sind dann [0.004...0.579]. Gut, damit kann man dann wohl alles oder nichts erklären.

Genau, die Fallzahl ist einfach zu klein und ein Konfidenzintervall von Null bis einhundert Prozent hilft nichts. Genau deshalb habe ich mir hier das Konfidenzintervall geklemmt. Zur Beantwortung der Fragestellung reichten der erste und zweite Testdurchgang aus.

Hier hätte ich 1 "schlechtes" auf auf 7 getestete gerechnet.

Aber die Fragestellung lautete

Die Frage ist wie hoch die Wahrscheinlichkeit für diese Art von Teilen ein "gut" Ergebnis zu liefern aus der Teststichprobe?

Da bin ich davon ausgegangen, dass mit Teststichprobe alle Teile gemeint sind.

Ich hätte einen Ansatz mit bedingten Wahrscheinlichkeiten erwartet,

Aber das ist doch eine bedingte Wahrscheinlichkeit. Wenn ich nur mit den 25 auffälligen Teilen rechne, dann ist das Ergebnis eine Wahrscheinlichkeit unter der Bedingung, dass ein Teil unter die 25 fällt, also auffälig war. Ich tue mich nur leichter, wenn ich mit konkreten, ganzen Zahlen arbeiten kann.

Isbjörn · von **Isbjörn** » Fr 9. Feb 2024, 09:26

Vielen Dank Klärung! Um die richtige Betrachtung zu finden brauchte ich den Input. Rechnen kann man viel, aber am Ende muss es auch stimmen, sonst kommt man zu den falschen Schlüssen.

STATISTIK-FORUM.de

Ist der Prozess ein Bernoulli-Prozess?

Ist der Prozess ein Bernoulli-Prozess?

Re: Ist der Prozess ein Bernoulli-Prozess?

Re: Ist der Prozess ein Bernoulli-Prozess?

Re: Ist der Prozess ein Bernoulli-Prozess?

Re: Ist der Prozess ein Bernoulli-Prozess?

Re: Ist der Prozess ein Bernoulli-Prozess?

Re: Ist der Prozess ein Bernoulli-Prozess?

Wer ist online?