Multiple lineare Regression bei nicht-normalverteilten AVs

Alle Verfahren der Regressionanalyse.

Multiple lineare Regression bei nicht-normalverteilten AVs

Beitragvon KatrinHa » So 22. Feb 2026, 12:58

Hallo zusammen,

Ich möchte den Einfluss von BMI auf Detektionsschwellen für Kälte, Wärme, Schmerz, Druck untersuchen. Insgesamt sind es 11 Parameter und meine Kohorte ist n = 130, davon jeweils die Hälfte Männer bzw. Frauen. DIe 11 Parameter sind nicht vormalverteilt, auch nach Logarithmierung teils nicht.
Zuerst hatte ich es ganz einfach mit einer Spearman's rank correlation versucht. Hier gab es eine - wenn auch eher gering ausgepägte - Korrelation von 6/11 Parametern mit BMI. Darauf habe ich aber die Kritik bekommen, dass unklar ist, ob die Korrelationen wirklich durch BMI selbst zustande kommen, oder ob es nicht eher Einfluss von Alter und Geschlecht ist.
Ich habe versucht, mir hier mit statistikguru.de zu helfen und würde eigentlich gerne eine multiple lineare Regression berechnen. Allerdings sind meine abhängigen Variablen wie gesagt nicht normalverteit und haben teils erhebliche Ausreßer.

Ich wäre sehr, sehr dankbar für Input, wie sich das lösen lässt!

VG Katrin
KatrinHa
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 6. Nov 2022, 08:03
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Multiple lineare Regression bei nicht-normalverteilten A

Beitragvon PonderStibbons » So 22. Feb 2026, 14:16

Ich möchte den Einfluss von BMI auf Detektionsschwellen für Kälte, Wärme, Schmerz, Druck untersuchen. Insgesamt sind es 11 Parameter und meine Kohorte ist n = 130, davon jeweils die Hälfte Männer bzw. Frauen. DIe 11 Parameter sind nicht vormalverteilt, auch nach Logarithmierung teils nicht.

Die Werte der AV müssen nicht aus einer normalverteilten Grundgesamtheit stammen. Wer hat Dir diesen Bären aufgebunden?
Allenfalls sollten die Modell-Vorhersagefehler (Residuen) aus einer normalverteilten Grundgeamtheit stammen. Aber auch
das ist nicht mehr relevant, wenn die Stichprobe groß genug ist (ab ca. n > 30). Zu transformieren, um tatsächliche
oder vermeintliche Verteilungsvoraussetzungen zu erfüllen, sollte man stets tunlichst unterlassen. Es sollte schon inhaltlich
Sinn ergeben, die Detektionsschwellen zu logarithmieren (ob es so sein könnte, kann ich nicht beurteilen).

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11395
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2511 mal in 2495 Posts

folgende User möchten sich bei PonderStibbons bedanken:
KatrinHa

Re: Multiple lineare Regression bei nicht-normalverteilten A

Beitragvon bele » So 22. Feb 2026, 14:42

Hallo Katrin,

zur Normalverteilung hat PonderStibbons ja schon alles Wesentliche gesagt. Hier kannst Du dazu einen zitierfähigen Beleg finden.

Dass die Korrelationen gering sind, war zu erwarten. Was war denn die Annahme? Dicke sind alle schmerzempfindlich dafür können Dünne keine Temperaturunterschiede fühlen? Alles andere als schwache Zusammenhänge wäre fragwürdig. Trotzdem macht es natürlich Sinn, Geschlechtsunterschiede zu berücksichtigen, man könnte sogar überlegen, das Alter einfach und quadriert (oder als spline) ins Modell zu nehmen, denn linear werden die Alterseffekte nicht sein, aber i.d.R. fängt man mit einfachen Modellen an und macht sie dann langsam komplexer.

Viel Erfolg,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5973
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1411 mal in 1397 Posts

folgende User möchten sich bei bele bedanken:
KatrinHa

Re: Multiple lineare Regression bei nicht-normalverteilten A

Beitragvon KatrinHa » So 22. Feb 2026, 16:08

Vielen Dank!
PonderStibbons hat geschrieben:Die Werte der AV müssen nicht aus einer normalverteilten Grundgesamtheit stammen. Wer hat Dir diesen Bären aufgebunden?
Allenfalls sollten die Modell-Vorhersagefehler (Residuen) aus einer normalverteilten Grundgeamtheit stammen. Aber auch
das ist nicht mehr relevant, wenn die Stichprobe groß genug ist (ab ca. n > 30).

Ergo ich rechne die ursorünglich geplante multiple lineare Regressionsanalyse ohne mir über Ausreißer Gedanken zu machen. Toll!

bele hat geschrieben: Was war denn die Annahme? Dicke sind alle schmerzempfindlich dafür können Dünne keine Temperaturunterschiede fühlen? Alles andere als schwache Zusammenhänge wäre fragwürdig. Trotzdem macht es natürlich Sinn, Geschlechtsunterschiede zu berücksichtigen, man könnte sogar überlegen, das Alter einfach und quadriert (oder als spline) ins Modell zu nehmen, denn linear werden die Alterseffekte nicht sein, aber i.d.R. fängt man mit einfachen Modellen an und macht sie dann langsam komplexer.


Die Idee war, dass mit höherem BMI bei zB bei abdominellen Druckschmerzmessungen höhere Schwellen gemessen werden, da das Bauchfett quasi "polstert".
Inwiefern wäre es bzgl Alter als Variable sinnvoll, das zu quadrieren? Also was ändert sich dadurch?

Viele Grüße

Katrin
KatrinHa
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 6. Nov 2022, 08:03
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Multiple lineare Regression bei nicht-normalverteilten A

Beitragvon PonderStibbons » So 22. Feb 2026, 18:10

Ergo ich rechne die ursorünglich geplante multiple lineare Regressionsanalyse ohne mir über Ausreißer Gedanken zu machen. Toll!

Deine Frage betraf Normalverteilung, nicht Umgang mit Auseißern. Wenn die Ausreißer zu einflussreich sind,
müsste man geeignete Methoden überlegen.

Ungeachtet dessen, falls wie gesagt es inhaltlich Sinn ergibt, Schmerzschwellen zu logarithmieren (aus der
Literatur müsste sich ersehen lassen, ob es regelmäßig so gehandhabt wird), dann nur zu. Kleinere Änderungen
der Reizintensivivtät werden meiner Erinnerung nach als unterschiedlich schmerzhaft empfunden, während
bei großen Intensivitäten dieselben Änderungen nicht als unterschiedlich schmerzhaft empfunden werden.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11395
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2511 mal in 2495 Posts

Re: Multiple lineare Regression bei nicht-normalverteilten A

Beitragvon bele » Mo 23. Feb 2026, 00:11

PonderStibbons hat geschrieben:Ungeachtet dessen, falls wie gesagt es inhaltlich Sinn ergibt, Schmerzschwellen zu logarithmieren (aus der
Literatur müsste sich ersehen lassen, ob es regelmäßig so gehandhabt wird), dann nur zu.


Da böte sich vielleicht das Weber-Fechner-Gesetz als Argumentationsgrundlage an, wenn das nicht schon in den Versuchsaufbau eingeflossen ist.

Ergo ich rechne die ursorünglich geplante multiple lineare Regressionsanalyse ohne mir über Ausreißer Gedanken zu machen. Toll!


So toll ist das auch nicht - nach der Regression solltest Du Dir die Residuen anschauen. Da können die Ausreißer nochmal hässlich werden.

Inwiefern wäre es bzgl Alter als Variable sinnvoll, das zu quadrieren? Also was ändert sich dadurch?


Zusammenhänge mit dem Alter sind meistens nicht linear. Am Anfang des Lebens nimmt die Zahl der Kerzen auf dem Kuchen linear mit dem Alter zu aber dann irgendwann hört das auf, weil man einem 50jährigen keine 50 Kerzen mehr auf die Torte macht. Das Leben verläuft eher in Abschnitten als geradlinig. Die Zahl verursachter tötlicher Unfälle steigt von 0 bis 20 Jahren an und nimmt von 60 bis 90 ab. Da eine Gerade durch zu legen ist vielleicht nicht so sinnvoll. Ein quadratischer Term ist meistens die erste Variante die man lernt, um einen Zusammenhang kurvilinear abzubilden. Ist hier aber wahrscheinlich nicht das führende Problem. Rechne erstmal ohne das.

bei abdominellen Druckschmerzmessungen höhere Schwellen gemessen werden, da das Bauchfett quasi "polstert".


Macht für mich erstmal keinen Sinn, aber ich kenne ja auch den Messaufbau nicht. Messt Ihr Schmerzen, die in der Haut entstehen oder Schmerzen, die in Muskeln und Eingeweiden entstehen? Messt ihr bei einer bestimmten Auslenkung der Oberfläche oder bei bestimmten Drücken? Bei letzterem überwindet Ihr ja die Polsterung (also Ihr würdet ja tiefer rein drücken bis ihr die gleiche Druckkraft habt und damit die Polsterung quasi umgehen).

Naja, rechne mal die muiltiple Regression und überleg Dir vorher, ob das Weber-Fechner-Gesetz die Rechtfertigung für eine Logarithmierung bietet. Das kann dann bei Ausreißern nach oben schon sehr helfen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5973
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1411 mal in 1397 Posts

Re: Multiple lineare Regression bei nicht-normalverteilten A

Beitragvon strukturmarionette » Do 26. Feb 2026, 14:38

Hi,

Ergo ich rechne die ursprünglich geplante multiple lineare Regressionsanalyse ohne mir über Ausreißer Gedanken zu machen. Toll!

- bedenke, dass die Prädiktorvariablen möglichst unabhängig voneinander (n1 bis nx Korrelationstabelle -deskriptiv- betrachten) sein sollten
- des Weiteren messfehlerfrei gemessen

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4372
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 587 mal in 584 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron