Vertrauensintervall der Regressionsgeraden

Alle Verfahren der Regressionanalyse.

Vertrauensintervall der Regressionsgeraden

Beitragvon Dietmar » Sa 7. Sep 2013, 13:40

Ich habe folgendes Problem:
Achsen werden mit Hebeln verschraubt und anschließend gegeneinander verdreht um das maximale Übertragungsmoment der Verbindung zu ermitteln. Um Streuungen mit zu berücksichtigen werden jeweils 6 Hebel mit demselben Schraubenanzugsmoment auf der Achse befestigt. So entstehen 30 Wertepaare in 5 Gruppen, d. h. auf 5 X-Werte werden jeweils 6 Y-Werte aufgetragen. Daraus berechne ich eine Regressionsgerade. Nun möchte ich den Vertrauensbereich der Regressionsgeraden berechnen, welcher einer T-Verteilung folgt, um die untere Grenze des maximal zu übertragenden Momentes zu ermitteln. Mit der RGP-Funktion berechne ich die notwendigen Parameter der Regressionsgeraden (die Steigung (m) und den Y-Abschnitt (b), sowie die Summe der Fehler von Y (SEy) und den Freiheitsgrad (df) um mit dem T-Wert die Abweichung der Y-Werte zu berechnen, welche den Vertrauensbereich darstellen... So weit so gut.
Das Problem sieht man wenn man die Werte in einer Kurve aufträgt. Fast alle Messwerte sind außerhalb des Vertrauensbereich, was nicht sein kann. Bei einer Fehlerwahrscheinlichkeit von z. B. 5% sollten 95% der Werte innerhalb des Vertrauensbereiches liegen... siehe beigefügte Excel Datei. In dieser habe ich die Berechnung des Vertrauensbereiches versuchsweise nur mit den Durchschnittwerten, den Min- und den Max-Werten der einzelnen Gruppen berechnet. Die Durchschnittswerte ergeben ein ähnliches Bild, bei den Min- und Max-Werten sieht die Sache schon etwas besser aus. Bei den Min-Werten liegen alle Messwerte oberhalb der unteren Vertrauensgrenze und bei den Max-Werten unterhalb der oberen Vertrauensgrenze

Was mache ich falsch???

Liebe Grüße - Dietmar
Dateianhänge
Regression with Confidence Interval in Excel.xlsx
(31.17 KiB) 236-mal heruntergeladen
Dietmar
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Fr 6. Sep 2013, 17:11
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Vertrauensintervall der Regressionsgeraden

Beitragvon Frequentist » So 8. Sep 2013, 14:57

Hallo Dietmar,

Dietmar hat geschrieben:
Das Problem sieht man wenn man die Werte in einer Kurve aufträgt. Fast alle Messwerte sind außerhalb des Vertrauensbereich, was nicht sein kann. Bei einer Fehlerwahrscheinlichkeit von z. B. 5% sollten 95% der Werte innerhalb des Vertrauensbereiches liegen... siehe beigefügte Excel Datei.

das Problem liegt meines Erachtens in deiner Interpretation eines 95%-Konfidenzitervalls. Ein Konfidenzintervall (KI) sagt nicht aus, dass z.B. 95% der Beobachtungen in ihm liegen müssen. Eine weitere (und viel häufiger auftretende) Fehlinterpretation eines KIs lautet, wie folgt: Mit einer Wahrscheinlichkeit von 95% liegt der wahre Parameter (hier: Mittelwert deiner abhängigen Variable) in diesem Intervall. Intervalle, welche dieser Interpretation genügen sind die Kredibilitätsintervalle. Sie sind Gegenstand der Baysianischen Statistik.

In der klassischen Statistik (KIs stammen aus ihr) hat sich der frequentistische Wahrscheinlichkeitsansatz durchgesetzt. Die Annahme dieses Ansatzes ist, dass die betrachteten Zufallsexperimente beliebig häufig wiederholt werden. Somit unterliegt das KI jener Interpretation:
Generieren wir uns beliebig viele Stichproben zu unserem Problem, so liegt in 95% der berechneten KIs der wahre, zu schätzende, Parameter.

Mit dem wahren Parameter ist der, der angenommenen Verteilung (Substanzwissenschaftler sagen auch Population) zu gehörige, zu schätzende Wert gemeint.

Liebe Grüße
F.
"Essentially, all models are wrong, but some are useful. However, the approximate nature of the model must always be borne in mind.",
Box, George E. P.; Draper, Norman R. (1987). Empirical Model-Building and Response Surfaces, p. 424, Wiley.
Frequentist
User
User
 
Beiträge: 33
Registriert: Sa 27. Jul 2013, 14:52
Danke gegeben: 3
Danke bekommen: 4 mal in 4 Posts

Re: Vertrauensintervall der Regressionsgeraden

Beitragvon stsQMBalance » Mi 23. Okt 2013, 11:04

Hallo Dietmar,
Du hast das im Prinzip richtig gemacht. Du musst nur auf einige Feinheiten achten:
Statt den Vertrauensbereich der Funktion zu berechnen, musst Du - so wie ich es aus deinem Text verstanden habe - den Vertrauensbereich der Werte berechnen. Dieser Bereich heißt Vorhersagebereich. Beide Bereiche sind nach "indirektem Schluss" auf Kenndaten - also auf die x-Werte - Vertrauensbereiche, demnach also t-verteilt (Student's t, das ist ein kleines "t" im Ggs. zu T der Thompson-Verteilung).
Der Unterschied liegt einfach im Wurzelterm (Formeln für die Gerade findest Du in DIN 32645, oder ISO 8466 oder im Bild unten).
Aber Vorsicht, da gibt es Randbedingungen. Im wesentlichen darf die Reststandardabweichung nicht zu hoch sein und die Auswertung gilt nur im durch Messpunkte gestützten Bereich.
Wenn Du die Aufgabenstellung mathematisch exakter - und allgemeingültiger(!) - angehen willst, dann ist auch das möglich, sprengt aber den Rahmen dieses Forums. Schick mir einfach eine e-mail und wir können das Problem leicht lösen (Zugang mit Passwort zu unserer "Formelsammlung", sorry das sind mehr als 100 PDF Seiten).
Zum "Selbermachen" hier die beiden wesentlichen Formeln (gelten nur für Geraden unter den obigen Randbedingungen):Bild.
Die gewollte Auswertung sieht dann so aus:Bild.
p.s.: Wie Du richtig erkannt hast, muss der für die Frage zutreffende Vertrauensbereich ermittelt werden. Für die Wahrscheinlichkeit des Vorkommens von Messwerten gilt im Bild: mindestens 95% der Messwerte liegen in diesem Bereich. Die Auffassung zu angeblichen Fehlinterpretationen des Vertrauensbereiches kann ich nicht teilen und ist meiner Kenntnis nach auch nicht Gegenstand irgendeiner Diskussion.
stsQMBalance
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Mi 23. Okt 2013, 08:16
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste