Fehlerrechnung bei nicht-normalverteilten Werten

Univariate Statistik.

Fehlerrechnung bei nicht-normalverteilten Werten

Beitragvon Benjamin3107 » Di 27. Sep 2022, 14:57

Hallo zusammen,

ich schreibe aktuell meine Masterarbeit im Fach Medizinische Physik und muss gestehen, dass Statistik inklusive Fehlerrechnung in meinem Studium definitiv zu kurz gekommen ist. Bisher kam ich tatsächlich mit Normalverteilungen, Gaußscher Fehlerfortpflanzung etc. aus, aber das scheint nun nicht mehr auszureichen.

Ich versuche einmal grundsätzlich mein Experiment zu erklären. Ich möchte letztendlich einen Wert C bestimmen und für diesen die entsprechenden Fehlergrenzen angeben. C berechnet sich dabei in vereinfachter Form als Verhältnis aus zwei Messwerten A und B, also C=A/B. A und B sind dabei Mittelwerte einer strikt positiven Messwertmenge für die ich eine Standardabweichung angeben kann. Gemäß Gaußscher Fehlerfortpflanzung müssten sich also die relativen Fehler addieren. Das führt dazu, dass ich teilweise einen relativen Fehler von 200% erhalte. Problematisch ist, dass es in meinem Experiment prinzipiell darum geht, B zu minimieren bzw. formell sogar B=0 zu erreichen, was natürlich aufgrund von Rauschen etc. nicht passiert. C ist somit also nach unten mit 0, aber nach oben formell gar nicht begrenzt. Hohe Standardabweichungen nach oben machen also Sinn, jedoch widerspricht eine Angabe von >100% nach unten über das klassische "±" der Definition des Messwertes C. Hinzu kommt, dass z.B. C=50 deutlich wahrscheinlicher ist, als C<1. Ich gehe also davon aus, dass sich eine Fehlerrechnung basierend auf einer Normalverteilung, wie ich sie durchgeführt habe, erübrigt.

Ich habe für alle meine Messreihen daher jeweils einen Shapiro-Wilk-Test mit alpha=0,05 zum Test der Normalverteilung von je A und B durchgeführt und erhalte keine konsistenten Ergebnisse, was die oben genannte Fehlerrechnung weiter in Frage stellt und mir nicht weitergeholfen hat.

Des Weiteren zeigt sich in Wiederholbarkeitsmessungen, dass sich C zwischen den Messreihen sehr gut reproduzieren lässt mit einer Standardabweichung von <6%, wodurch es für mich kontraintuitiv erscheint die Messwerte der Einzelmessungen mit Fehlergrenzen von 200% angeben zu müssen.

Leider konnte ich bisher keine Herangehensweise für die Fehlerrechnung finden, die meinem Fall einer Verteilung entspricht. Ich wäre sehr dankbar für jeden Hinweis, wie eine korrekte Fehlerrechnung in meinem Fall anzugehen ist. Vielen Dank im Voraus für eure Mühen!

Viele Grüße,

Benjamin
Benjamin3107
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 27. Sep 2022, 12:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Fehlerrechnung bei nicht-normalverteilten Werten

Beitragvon bele » Di 27. Sep 2022, 15:19

Hallo Benjamin,

Benjamin3107 hat geschrieben:Ich möchte letztendlich einen Wert C bestimmen und für diesen die entsprechenden Fehlergrenzen angeben. C berechnet sich dabei in vereinfachter Form als Verhältnis aus zwei Messwerten A und B, also C=A/B.


Ich verstehe nichts von Fehlerfortpflanzung, aber da gehen bei mir die Warnlampen an: Division zweier normalverteilter Zufallsvariablen führt ganz schnell zur Cauchy-Verteilung und die hat keine definierte Varianz: https://en.wikipedia.org/wiki/Cauchy_distribution Vielleicht ist es ja ein großes Glück, dass A und B gar nicht normalverteilt sind.

A und B sind dabei Mittelwerte einer strikt positiven Messwertmenge für die ich eine Standardabweichung angeben kann.


Nun beschreibt leider eine Standardabweichung eine Verteilung nur dann, wenn beispielsweise Normalverteilung vorgegeben ist, was hier nicht der Fall ist.

Wie schon geschrieben, weiß ich nichts über Fehlerfortschreibung - habe ich nie gelernt. In Ermangelung echten Wissens würde ich mich wahrscheinlich daran machen, eine Simulation zu rechnen. Wenn man jetzt die Verteilung von A und B entweder parametrisch (HUST*Lognormal?*HUST) angeben könnte oder durch eine große Zahl von Messungen beschreiben könnte, dann ließe sich ja vielleicht durch Simulation der Fehler von A und B abschätzen?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5188
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 13
Danke bekommen: 1196 mal in 1185 Posts

Re: Fehlerrechnung bei nicht-normalverteilten Werten

Beitragvon Benjamin3107 » Mi 28. Sep 2022, 14:14

Hallo Bernhard,

vielen Dank für deine Antwort. Ohne mich davor drücken zu wollen, kompliziertere Verteilungen zu implementieren, weiß ich nicht, wie zielführend das für mein Problem ist. Vermutlich vereinfache ich mir die Thematik zu sehr, aber im Idealfall hätte ich gerne einen Parameter ähnlich wie eine Standardabweichung, der den Fehler meiner Messwerte abschätzt. Eine Verteilung, die einen solchen direkt greifbaren Parameter nicht aufweist, hilft mir möglicherweise gar nicht weiter, auch wenn es das Problem besser beschreibt.

Was genau meinst du mit einer Simulation rechnen? Ich habe innerhalb jeder Messreihe mehr als 140 Messwerte für A und B. Meinst du daraus lässt sich der Fehler auch bei Nicht-Normalverteilung abschätzen? Wie ich bereits gesagt habe, habe ich auch Wiederholbarkeitsmessungen jeder Messreihe durchgeführt. Dabei hat sich dann gezeigt, dass sich C sehr reproduzierbar bestimmen lässt, was darauf schließen lässt, dass der Fehler für A und B nicht sehr groß sein kann. Die Abweichung aus den Wiederholbarkeitsmessungen jedoch einfach generell als Abweichung der Einzelmessungen anzugeben, halte ich nicht für richtig.

Wenn ich den Fehler von A und B kennen würde, ergäbe sich jedoch auch noch weiter das Problem, wie ich diese zu einem letztendlichen Fehler von C verrechne, wenn nicht über Gaußsche Fehlerfortpflanzung. Da du erwähnt hast, dass die Thematik nicht deiner Expertise entspricht, möchte ich dich auch gar nicht weiter damit einspannen. Falls du zu dem oben genannten keine fixe Idee haben solltest, bedanke ich mich bis hierhin und werde weiterschauen, wie ich meine Fehlerrechnung angehen kann :)

Viele Grüße,

Benjamin
Benjamin3107
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 27. Sep 2022, 12:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Fehlerrechnung bei nicht-normalverteilten Werten

Beitragvon bele » Mi 28. Sep 2022, 18:05

Hallo Benjamin,

Benjamin3107 hat geschrieben:Eine Verteilung, die einen solchen direkt greifbaren Parameter nicht aufweist, hilft mir möglicherweise gar nicht weiter, auch wenn es das Problem besser beschreibt.
[...]
Da du erwähnt hast, dass die Thematik nicht deiner Expertise entspricht, möchte ich dich auch gar nicht weiter damit einspannen.

Ich will mich Dir auch gar nicht aufdrängen und ich glaube nicht, dass jemand anders sich wegen meiner Wortmeldung weniger einbringen würde als ohne. Du hast Dich nun nicht an ein Mathematikforum, sondern an ein Statistikforum gewandt und deshalb sind unerwartete Antworten möglich. Fehlerfortpflanzung ist hier nicht so das zentrale Thema. Wenn Dir das nicht weiter hilft ist das natürlich schade, ich weiß aber auch noch nicht so genau, bei was genau die richtige Antwort weiter helfen würde.

Ich habe innerhalb jeder Messreihe mehr als 140 Messwerte für A und B. Meinst du daraus lässt sich der Fehler auch bei Nicht-Normalverteilung abschätzen?

Ich weiß nicht, ob es Dir hilft. Aber wenn ich 140 Messwerte (unabhängige Messwerte aus der gleichen Verteilung, sog. i.i.d.) habe und den Fehler (beispielsweise des Mittelwertes) bestimmen möchte, dann gibt es dafür den parametrischen Weg, zum Beispiel die Annahme einer mathematisch beschreibbaren Verteilung und das Schätzen der Parameter der Verteilung anhand der Daten oder den Nichtparametrischen, beispielsweise durch Resampling. Beim Resampling mischt man aus den vorhandenen 140 Beobachtungen immer wieder andere Zusammenstellungen der Beobachtungen die ebensogut hätten auftreten können und bestimmt daraus die Statistik, deren Streuung (etc.) man bestimmen möchte. Ich weiß nicht, was Dir hilft, aber wenn das für Dich interessant sein sollte, dann lautet ein geeigneter Suchbegriff Bootstrapping (mehr).

Wenn ich den Fehler von A und B kennen würde, ergäbe sich jedoch auch noch weiter das Problem, wie ich diese zu einem letztendlichen Fehler von C verrechne, wenn nicht über Gaußsche Fehlerfortpflanzung.

In der Resamplingstatistik würde man aus i.i.d.-Messungen von A zehntausend Boostrap-Samples ziehen und für B ebenso und daraus zehntausend mal das Verhältnis C rechnen oder, wenn es gepaarte Beobachtungen sind, zehntausend Bootstrap-Samples der Paare A und B. Man hätte so jedenfalls zehntausend denkbare Werte für C, die alle streng positiv sind und die gemeinsam eine Verteilung von C beschreiben.

Falls das alles für Deinen Kontext keinen Sinn ergibt, ignoriere diese Nachricht gerne. Vielleicht habe ich ja auch nur was falsch verstanden.

Viel Erfolg mit Deinen Nachforschungen,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5188
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 13
Danke bekommen: 1196 mal in 1185 Posts


Zurück zu Mittelwert, Standardabweichung & Co.

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste