Seite 1 von 1

Unterschiede zwischen regressoren

BeitragVerfasst: So 11. Feb 2018, 22:43
von Donferrnando
Hallo zusammen,

angenommen ich habe mehrer Regressoren mit denen ich zb. die Wuchshöche bei Mais bestimmen soll. Alle Regressoren habe die selbe metrische Einheit. Wuchshöhe bei Mais wurde per Hand gemessen. Mit jedem Regressor wurde eine lineare Regression durch

Ich soll jetzt aussagen darüber machen welcher Regressor der beste von allen ist. Dabei ist es aber so, dass manche beim R² recht nahe beieinander liegen (sind teilweise nur 0.01 auseinander) und auch der RMSE unterscheidet sich bei denen kaum.

Kann man trotzdem sagen Regressor XY ist der bevorzugte auch wenn er nur marginal besser ist?

R² und RMSE beschreiben ja eigentlich schon wie gut die Regression passt, aber wenn die unterschiede so gering sind dachte ich daran einen Signifikanztest (LSD oder HSD) zwischen den Regressoren zu machen um evtl. signf. Unterscheide herauszufinden. Wenn der Test keine Unterschiede heraus finden würde, wäre es egal welcher Regressor benutzt würde.

Ich bin mir aber gerade nicht sicher, ober dieser Rückschluss nicht falsch ist und ich eher das Ergebnis der Regressionen auf signif. Unterschiede Testen soll. Also F-statistik oder sowas in die Richtung.

Viele Grüße,

Robert

Re: Unterschiede zwischen regressoren

BeitragVerfasst: So 11. Feb 2018, 23:09
von strukturmarionette
Hi,

- du musst das zunächst (fachlich) genauer beschreiben.
. dann weiterschauen..

Gruß
S.

Re: Unterschiede zwischen regressoren

BeitragVerfasst: Mo 12. Feb 2018, 18:34
von Donferrnando
Ok, dann fange ich mal ganz vorne an:

Die Daten die habe, sind Daten von einer Versuchsfläche mit 200 Parzellen die mit einem LiDAR gescannt wurden. Aus diesen LiDAR Daten habe ich 3D-Punktewolken erstellt und davon für jede Parzelle verschiedene Perzentile berechnet, die die Punkteverteilung entlang der Z-Achse beschreiben. Also zB. das 50-Perzentil gibt mir den Höhenwert auf dem 50% aller Punkte denselben oder einen niedrigeren Wert haben. Wuchshöhe und Perzentil haben deshalb die selbe Einheit.

Von jeder Parzelle gibt es eine Handmessung der Wuchshöhe und meine Aufgabe ist es nun herauszufinden, ob man aus den Perzentilen die Wuchshöhe bestimmen kann weshalb ich für jedes Perzentil eine eigene lineare regression mit der Handmessung gemacht habe. Nun gibt es eben Perzentile die beim R² oder RMSE sehr sehr nah beiander liegen bzw. auch manchmal das selbe Ergebnis liefern.

Sagen wir mal als bsp, die Regression zwischen Wuchshöhe~Perzentil 70 hat ein R²=0.576 und ein RMSE=86mm. Die Regression zwischen Wuchshöhe~Perzentil 80 hat ein R²=0.576 und RMSE=87mm.

Kann ich allein vom RMSE nun sagen, die Regression mit Perzentil 70 liefert das bessere Model? Oder ist der Unterschied so gering, dass ich nicht sagen kann welches Perzentil besser ist?

Um das nun heraus zu finden war meine Idee einen signifikanztest zwischen den Perzentilen zu machen um zu zeigen ob sie sich signifikant unterscheiden oder nicht (ich arbeite das meistend mit einem LSD oder einem HSD test).
Wäre nun das Ergebnis des Signifikanztests folgender, dass der Unterschied zwischen Perzentil 70 und 80 signifikant ist. Dann würde ich sagen: ok, Regression mit Perzentil 70 liefert das bessere Model weil unterschied zu Perzentil 80 ist signifikant und RMSE ist, wenn auch geringfügig, niedriger.

Ich hoffe das Beschreibt es nun ein wenig besser? Falls nicht sag doch bitte was für Info's du noch brauchen würdest

Viele Grüße,

Robert

Re: Unterschiede zwischen regressoren

BeitragVerfasst: Di 13. Feb 2018, 14:04
von bele
Hallo Robert,

Sowohl das als auch RMSE messen jeweils, wie gut die Regression die vorhandene Stichprobe beschreiben. Du willst aber wissen, wie gut Du das Modell zur Vorhersage von neuem verwenden kannst. Schau Dir mal die Verfahren der Kreuzvalidierung /Cross-validation an. Das kommt jetzt mehr aus der Ecke des Maschinellen Lernen als der linearen Regression, aber ich könnte mir vorstellen, dass Dir das mit Deinem Problem hilft.

https://de.wikipedia.org/wiki/Kreuzvali ... sverfahren

LG,
Bernhard

Re: Unterschiede zwischen regressoren

BeitragVerfasst: Di 13. Feb 2018, 18:52
von Donferrnando
Super, vielen Dank! Ich werf mal einen Blick drauf :)

Re: Unterschiede zwischen regressoren

BeitragVerfasst: Do 15. Feb 2018, 20:29
von Donferrnando
Für alle die mitlesen:

Die richtige Methode um Regressionen auf Unterschiede zu testen ist die ANCOVA

Viele Grüße,

Robert