Reproduzieren fester Werte mit statistischen Methoden

Fragen, die sich auf kein spezielles Verfahren beziehen.

Reproduzieren fester Werte mit statistischen Methoden

Beitragvon Honig » Di 7. Jan 2020, 11:31

Hallo liebe Statistik Gemeinde,

Zuallererst wünsche ich verspätet ein gesundes und gutes neues Jahr!
Als ziemlicher Statistik-Neuling stehe ich nun vor einer Aufgabe, die sich zumindest für mich als Laien nach Regression anhört.

Es geht um die Vorhersage bzw. das Reproduzieren von Werten aus jeweils zwei anderen. Konkret habe ich Prüfstandsdaten dreier Teile (A, B und C, wobei C die Kombination aus A und B ist). Die Werte sind zeilenweise nach Iterationsschritten aufgelistet, für jeden Iterationsschritt (insgesamt 22) habe ich also drei Werte, jeweils einen für A, B und C.
Die Aufgabe besteht nun darin, anhand der festen Werte von A und B eine Rechenvorschrift, eine Formel oder generell einen verwertbaren Zusammenhang zu finden, um auf die jeweiligen Werte von C zu kommen bzw. diesen möglichst nahe zu kommen. In einem Diagramm mit den C-Werten auf der Ordinate und den Iterationsschritten auf der Abszisse bildet sich ein ungefähr S-förmiger Graph, den ich zu reproduzieren versuche.

Mir persönlich fällt es nun schwer, die Informationen aus dem Internet und aus der Fachliteratur auf meine konkrete Aufgabenstellung anzuwenden, da in diesen Quellen immer von Stochastik, Wahrscheinlichkeiten, Normalverteilung der Daten und Zufallswerten die Rede ist, ich jedoch feste Werte habe, die ich benutzen will und soll, um möglichst in die Nähe anderer fester Werte zu gelangen.
Hinzu kommt, dass in der Literatur hauptsächlich die lineare Regression behandelt wird, ich aber aufgrund des ungefähr S-förmigen Graphen davon ausgehe, es hier (wenn überhaupt) mit einer multiplen nichtlinearen Regression zu tun zu haben.

Meine Fragen sind nun:
1. Handelt es sich hier um ein Problem, was man eurer Meinung nach mit einer Regressionsanalyse lösen kann?
2. Wenn ja, nach welcher Art der Regression sollte ich suchen/nachschlagen?
3. Bis jetzt bin ich immer wieder beim Stichwort "Regression" hängen geblieben. Gibt es evtl. ein anderes Verfahren, welches ich für meine Fragestellung nutzen kann (oder sollte)?

Für euren Input bin ich sehr dankbar!

Viele Grüße
Honig

P.S. Ich habe diese Frage erstmal unter "Allgemeine Fragen" gestellt, da ich mir bzgl. des Verfahrens nicht sicher bin. Ich hoffe, das ist ok.
Honig
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 6. Jan 2020, 22:01
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Reproduzieren fester Werte mit statistischen Methoden

Beitragvon bele » Di 7. Jan 2020, 12:28

Hallo Honig,

ich finde Deine Erklärung in Teilen schwer nachvollziehbar. Ich weiß nicht, was für ein Prüfstand das ist oder was für Werte da erhoben werden und deshalb kann ich mit dem Begriff Iterationsschritte nichts anfangen. Dieser scheint mir aber für die Detailsbeantwortung zentral zu sein. Wenn Du "drei Teile" schreibst, sind damit drei Teiletypen A, b und C gemeint und es liegen Messungen von ganz vielen A, ganz vielen B und ganz vielen C vor, oder gibt es je nur ein A, ein B und ein C? Manchmal helfen Teile dieses Post beim Formulieren besser zu beantwortender Fragen: nutzung-des-forums-f44/das-musste-mal-gepostet-werden-t6682.html

Ansonsten klingt Deine Schilderung durchaus so, dass das Stichwort "Regression" richtig ist. Es gibt viele Regressionsverfahren und durchaus nicht nur lineare Regression. Dennoch gibt es viele Texte über lineare Regression, weil diese sich für sehr viele Probleme am Ende sehr gut eignet. Es gibt auch Variationen der linearen Regression, die S-förmige Zusammenhänge abbilden können. Das hängt aber alles sehr von den Details ab (gibt es zum Beispiel einen kleinstmögliche und einen größtmöglichen Wert für die S-Kurve (quasi: Werte müssen zwischen 0% und 100% liegen) oder gibt es das nicht?).

da in diesen Quellen immer von Stochastik, Wahrscheinlichkeiten, Normalverteilung der Daten und Zufallswerten die Rede ist, ich jedoch feste Werte habe, die ich benutzen will und soll, um möglichst in die Nähe anderer fester Werte zu gelangen.


Deine "festen Werte" sind aber wahrscheinlich das Ergebnis eines Zufallsexperiments. Wenn Du mit gleichartigen Bauteilen den gleichen Versuch wiederholst wirst Du zwar ähnliche aber nicht identische Ergebnisse erhalten. Außerdem werden nicht alle A, B und C identisch sein, sondern es wird Produktionsschwankungen geben. Die Anwendung stochastischer bzw statistischer Methoden auf Deine festen Werte ist deshalb nicht a priori absurd.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5766
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1351 mal in 1338 Posts

Re: Reproduzieren fester Werte mit statistischen Methoden

Beitragvon Honig » Di 7. Jan 2020, 14:45

Hallo Bernhard,

danke erstmal für Deine schnelle Antwort. Ich hatte den von Dir verlinkten Beitrag gelesen, wollte meinen Eingangspost allerdings nicht noch länger machen, als er schon ist, entschuldige bitte die dadurch entstandenen vagen Aussagen.

Bei meinem Problem geht es um poröse Bauteile, deren "Filtrationsperformance" durch den Prüfstand gemessen wird. Diese wird dabei anhand der gefilterten Teilchengröße bestimmt. Da die Teilchengrößenschritte nicht im gleichen Abstand steigen, habe ich das Wort Iterationsschritt benutzt. Iterationsschritt 1 ist also die erste gemessene Teilchengröße, Iterationsschritt 2 die zweite usw.
Insgesamt werden 22 solcher Teilchengrößen betrachtet, zu denen dann jeweils ein Wert zu A, B und C gehört.

Was meine Analyse angeht, bin ich nicht auf Bauteile ABC beschränkt. Ich könnte auch andere, nennen wir sie D, E und F, nehmen. In allen Fällen will ich die Werte der Kombination (C, F) mithilfe der jeweiligen Werte der einzelnen Bauteile (A, B oder D, E) möglichst genau reproduzieren. Bis auf das angewandte Verfahren und die ungefähre Verteilung (S-Funktion) haben die Analysen von ABC und DEF allerdings nichts miteinander zu tun, da die absoluten Werte jeweils unterschiedlich sind und es auch andere Bauteile sind. Aus diesem Grund wäre es mir lieber, mit den absoluten Werten statt mit Werten zwischen 0 und 1 zu arbeiten. Sollte das allerdings nicht anders gehen (wie bspw. bei der logistischen Regression, wie ich es verstanden habe), dann muss das dann halt so sein.

bele hat geschrieben:Ansonsten klingt Deine Schilderung durchaus so, dass das Stichwort "Regression" richtig ist. Es gibt viele Regressionsverfahren und durchaus nicht nur lineare Regression. Dennoch gibt es viele Texte über lineare Regression, weil diese sich für sehr viele Probleme am Ende sehr gut eignet. Es gibt auch Variationen der linearen Regression, die S-förmige Zusammenhänge abbilden können.


Das klingt schonmal vielversprechend, danke schonmal!
Honig
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 6. Jan 2020, 22:01
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Reproduzieren fester Werte mit statistischen Methoden

Beitragvon bele » Di 7. Jan 2020, 16:47

Hallo Honig,

Da die Teilchengrößenschritte nicht im gleichen Abstand steigen, habe ich das Wort Iterationsschritt benutzt.


Was sind Teilchengrößenschritte? Ich vermute, dass Teilchengröße etwas ist, das Du beim Messen manipulierst und dass Du das in ungleich großen Schritten tust und das das etwas mit den "Iterationsschritten" zu tun haben könnte aber allmählich werden das zuviele Vermutungen.


Was meine Analyse angeht, bin ich nicht auf Bauteile ABC beschränkt. Ich könnte auch andere, nennen wir sie D, E und F, nehmen.


verwendest Du genau ein Exemplar von A, von B und dann von deren Kombination namens C oder gibt es eine Messserie mit vielen ?


Ich verstehe das jetzt mal so: Du nimmst genau einmal ein Bauteil A in die Hand, misst dann für 22 verschiedene Teilchengrößen wieviel bei der Filtration durchgehen und trägst dann auf der x-Achse die eingesetzte Teilchengröße in µm und auf der y-Achse die durchgegangene Menge in Gramm auf. Da soll jetzt eine Kurve durchgelegt werden, die zu diesen 22 Punkten gut passt.

Du willst Dir aber nicht für alle 22 Punkte den Wert merken sondern es soll eine Formel oder ein Rechenweg erstellt werden. Die Kurve ist irgendwie s-förmig. Stimmt das so, oder ist es anders?

An eine s-förmige Kurve kann man eine logistische Funktion anpassen, eine probit Kurve anpassen, eine Sinus-Kurve anpassen oder ein Polynom anpassen, bestimmt noch eine Reihe weiterer Funktionen (Bezierkurven, ...). Um eine geeignete herauszusuchen kannst Du visuell prüfen, welche passen könnte, Du könntest viele davon ausprobieren oder Du könntest nachdenken, was Du über die Physik der Filtration weißt und eine theoriebasierte Entscheidung für eine Kurvenform treffen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5766
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1351 mal in 1338 Posts

Re: Reproduzieren fester Werte mit statistischen Methoden

Beitragvon Honig » Di 7. Jan 2020, 17:42

Hallo Bernhard,

danke für Deine Mühe!

bele hat geschrieben:Was sind Teilchengrößenschritte? Ich vermute, dass Teilchengröße etwas ist, das Du beim Messen manipulierst und dass Du das in ungleich großen Schritten tust und das das etwas mit den "Iterationsschritten" zu tun haben könnte aber allmählich werden das zuviele Vermutungen.


Es werden standardisierte Testpartikel verwendet, die unterschiedliche Größen aufweisen. Der Prüfstand misst dabei nicht alle, sondern nur ausgewählte Größen. Also nicht 1, 2, 3, ... , 22 µm, sondern vielmehr 1, 2, 4, 5, 6, 7, 11, 12, 15µm (Bsp.) usw. ohne erkennbare Struktur. Um dies in der Darstellung zu umgehen wird das "umcodiert". Die kleinste gemessene Teilchengröße ist Teilchengröße 1 und ich gehe dann einen Schritt zur nächstgrößeren gemessenen Teilchengröße. Auf der x-Achse sind also keine Werte in µm, sondern die Zahlen 1-22 in gleichbleibenden Schritten. 22 ist also die Anzahl der gemessenen Größen. "Teilchengrößenschritt" deshalb, um keine Flüchtigkeitsfehler beim Ablesen zu machen, also damit nicht automatisch angenommen wird: "Teilchengröße 5 bedeutet Teilchengröße = 5µm".

Jetzt verstehe ich aber auch deine Verwirrung bzgl. des Wortes "Iterationsschritt". Entschuldige dafür.

bele hat geschrieben:verwendest Du genau ein Exemplar von A, von B und dann von deren Kombination namens C oder gibt es eine Messserie mit vielen ?


Ersteres.

bele hat geschrieben:Ich verstehe das jetzt mal so: Du nimmst genau einmal ein Bauteil A in die Hand, misst dann für 22 verschiedene Teilchengrößen wieviel bei der Filtration durchgehen [...] Da soll jetzt eine Kurve durchgelegt werden, die zu diesen 22 Punkten gut passt.


Genau.

bele hat geschrieben:Du willst Dir aber nicht für alle 22 Punkte den Wert merken sondern es soll eine Formel oder ein Rechenweg erstellt werden. Die Kurve ist irgendwie s-förmig. Stimmt das so, oder ist es anders?


Genau. Wobei ich vor alledem überhaupt erstmal untersuchen will, ob überhaupt ein rechnerischer Zusammenhang zwischen den Werten von A und B und den Werten von C besteht. Sollte das funktionieren soll anschließend geprüft werden, ob diese Formel/dieser Zusammenhang/dieser Rechenweg, angepasst an die jeweiligen Werte, auch für andere Bauteile bzw. andere Bauteilkombinationen passt.

bele hat geschrieben:An eine s-förmige Kurve kann man eine logistische Funktion anpassen, eine probit Kurve anpassen, eine Sinus-Kurve anpassen oder ein Polynom anpassen, bestimmt noch eine Reihe weiterer Funktionen (Bezierkurven, ...).


Danke, insbesondere für den Begriff "Bezierkurven", den kannte ich noch nicht.

LG
Honig
Honig
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 6. Jan 2020, 22:01
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 7 Gäste