Varianzanalyse möglich wenn Parameter nicht gegeben sind?

Alles zu (M)ANOVA, ALM...

Varianzanalyse möglich wenn Parameter nicht gegeben sind?

Beitragvon Studi-DE » Di 2. Jun 2020, 09:10

Hallo zusammen,

erstmal sehr schön, dass es dieses Forum gibt und ich hoffe mir kann hier jemand vom Fach weiterhelfen.

Es geht um meine Abschlussarbeit, die ich im Unternehmen schreibe.

Im Rahmen der Arbeit untersuche ich die Auslastung von Transporten und möchte überprüfen ob der jeweilige Fahrzeugtyp einen Einfluss auf das Ergebnis der Auslastung hat. Das bedeutet ich habe folgende Daten:

-Unabhängige Variable: Fahrzeugtyp (nominalskaliert)
Typ A, Typ B, Typ C (Stichproben sind stark unterschiedlich zw. 30 und 250)
-Abhängige Variable: Auslastungswerte (ratioskaliert)

Im Grunde müsste das doch erstmal sehr gut sein für eine ANOVA oder?
Da ich jedoch dann die Vorgaben für die ANOVA geprüft habe, musste ich leider feststellen, dass keine Varianzhomogenität und auch keine Normalverteilung der Residuen (der Y Variable) vorliegt. Hinzu kommen starke Ausreißer in den einzelnen Auslastungswerten, die aber eigentlich auch für die Arbeit relevant sind. Eine Prüfung der Varianzhomogenität ergab zudem dass diese nicht vorliegt.

Dann dachte ich mir gut, dann steige ich eben auf ein nicht parametrisches Verfahren wie den Kruskal-Wallis Test um, allerdings setzt der einen ähnlichen „Shape“ der Verteilung der Gruppen voraus (Also der Y Wert in Relation zur Gruppe). Auch das ist nicht gegeben. Ich verzweifle so langsam und frage mich ob das überhaupt noch was wird mit der Auswertung. Gibt es denn noch irgendwas was ich machen kann und das halbwegs statistisch sauber auszuwerten? Vielleicht bin ich zu perfektionistisch, aber die Daten sind nun mal eben so wie sie sind.


Die Stichprobe ist ja eigentlich groß genug und könnte somit eine Normalverteilung der Residuen sicherstellen oder? Dann würde doch prinzipiell eine Welch-Anova in Ordnung sein, trotz Nicht-Erfüllung der Varianzhomogenität. Oder muss ich dann trotzdem hier eine Normalverteilung mittels Histogramm nachweisen?

Danke vielmals vorab für jegliche Form der Unterstützung.

Mit freundlichen Grüßen
Studi-DE
Studi-DE
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Di 2. Jun 2020, 08:55
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Varianzanalyse möglich wenn Parameter nicht gegeben sind

Beitragvon PonderStibbons » Di 2. Jun 2020, 09:54

Da ich jedoch dann die Vorgaben für die ANOVA geprüft habe, musste ich leider feststellen, dass keine Varianzhomogenität und auch keine Normalverteilung der Residuen (der Y Variable) vorliegt.

Normalverteilung der Residuen (in der Grundgesamtheit) ist bei kleinen Stichproben
wünschenswert. Dein Gesamt-n ist allemal ausreichend, dass die Varianzanalyse auch
ohne Normalverteilung der Residuen robust ist (vgl. zentraler Grenzwertsatz). Für
inhomogene Varianzen gibt es Korrekturverfahren (Welch, Brown-Forsythe).

Dann dachte ich mir gut, dann steige ich eben auf ein nicht parametrisches Verfahren wie den Kruskal-Wallis Test um, allerdings setzt der einen ähnlichen „Shape“ der Verteilung der Gruppen voraus (Also der Y Wert in Relation zur Gruppe).

Das ist ein Verfahren für Rangdaten, also gibt es gar keinen "Shape". Vielleicht wurde
diese Bedingung genannt, um einen statistisch signifikanten Kruskal-Wallis-Test als Indiz
für Mittelwertunterschiede interpretieren zu können. Welche tieferen Sinn das haben
soll, weiß ich allerdings nicht.
Die Stichprobe ist ja eigentlich groß genug und könnte somit eine Normalverteilung der Residuen sicherstellen oder?

Wieso sollte eine Nichtnormalverteilung sich in eine Normalverteilung verwandeln,
wenn sie auf 500 statt auf 50 Fällen beruht? Es geht vielmehr darum, dass bei kleinen
Stichproben diese Bedingung einen zuverlässigen F-Test ermöglich, bei größeren
Stichproben geht es auch ohne sie.
Dann würde doch prinzipiell eine Welch-Anova in Ordnung sein, trotz Nicht-Erfüllung der Varianzhomogenität.

Die ist ausdrücklich zur Korrektur für Varianzinhomogenität.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11257
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2471 mal in 2455 Posts

Re: Varianzanalyse möglich wenn Parameter nicht gegeben sind

Beitragvon Studi-DE » Di 2. Jun 2020, 10:51

Hallo PonderStibbons,

zuerst einmal herzlichen Dank für deine sehr schnelle Rückmeldung. Es gibt also doch noch Hoffnung :-)

PonderStibbons hat geschrieben:Da ich jedoch dann die Vorgaben für die ANOVA geprüft habe, musste ich leider feststellen, dass keine Varianzhomogenität und auch keine Normalverteilung der Residuen (der Y Variable) vorliegt.

Normalverteilung der Residuen (in der Grundgesamtheit) ist bei kleinen Stichproben
wünschenswert. Dein Gesamt-n ist allemal ausreichend, dass die Varianzanalyse auch
ohne Normalverteilung der Residuen robust ist (vgl. zentraler Grenzwertsatz). Für
inhomogene Varianzen gibt es Korrekturverfahren (Welch, Brown-Forsythe).


Ich habe das immer so verstanden, dass die Verteilung einer Normalverteilung ähneln muss, auch bei großen Stichproben.
Laut deiner Aussage, kann ich daher also auf den Shapiro-Wilk-Test verzichten korrekt und ein Verweis auf die Größe der Stichproben / Gesamt-N genügt?

PonderStibbons hat geschrieben:Dann würde doch prinzipiell eine Welch-Anova in Ordnung sein, trotz Nicht-Erfüllung der Varianzhomogenität.

Die ist ausdrücklich zur Korrektur für Varianzinhomogenität.


Verstehe. Also dementsprechend bei mir passend, da ich eine Varianzhomogenität vorliegen habe und die Normalverteilung der Residuen durch eine große Stichprobe sichergestellt habe.

Muss ich die Ausreißer in der Analyse irgendwie erwähnen? Die stellen definitiv einen Optimierungspunkt für meine abhängige Variable dar.

Sorry für die teils "doofen" Fragen. Ich bin einfach nur noch verunsichert.

Mit freundlichen Grüßen
Studi-DE
Studi-DE
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Di 2. Jun 2020, 08:55
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Varianzanalyse möglich wenn Parameter nicht gegeben sind

Beitragvon PonderStibbons » Di 2. Jun 2020, 11:31

Das Kernproblem der Analyse ist die Verwendung eines Prozentsatzes als abhängige Variable, also eine Variable,
die von vornherein auf den Bereich 0 bis 100 begrenzt ist. Ich weiß nicht, in welchen Bereichen sich die Auslastungen
abspielen und ob es Deckeneffekte gibt (viele 100%-Werte).
Verstehe. Also dementsprechend bei mir passend, da ich eine Varianzhomogenität vorliegen habe und die Normalverteilung der Residuen durch eine große Stichprobe sichergestellt habe.

Was denn nun? Du schriebst von inhomogenen Varianzen (in Verbindung mit einer unterschiedlichen Stichptrobengröße,
was der eigentliche Knackpunkt ist). Daher schlug ich Welch oder Brown-Forsythe vor, die damit klarkommen.

Und Normalverteilung der Residuen wird NICHT durch eine große Stichprobe sichergestellt. Die bleiben nichtnormal.
Die nichtnormal verteilten Residuen schaden aber nicht dem F-Test, wenn die Stichprobe so wie hier groß genug ist.
Muss ich die Ausreißer in der Analyse irgendwie erwähnen? Die stellen definitiv einen Optimierungspunkt für meine abhängige Variable dar.

Ich weiß nicht wie bei Dir Ausreißer definiert sind. Du kannst eine 2. Analyse zur Überprüfung der Robustheit
der Ergebnisse machen unter Weglassen der "Ausreißer" (wenn es nur einige wenige sind). Wenn es aufs selbe
hinausläuft, schön. Wenn nicht, muss man das diskutieren.



Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11257
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2471 mal in 2455 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Studi-DE

Re: Varianzanalyse möglich wenn Parameter nicht gegeben sind

Beitragvon Studi-DE » Di 2. Jun 2020, 12:09

PonderStibbons hat geschrieben:Das Kernproblem der Analyse ist die Verwendung eines Prozentsatzes als abhängige Variable, also eine Variable,
die von vornherein auf den Bereich 0 bis 100 begrenzt ist. Ich weiß nicht, in welchen Bereichen sich die Auslastungen
abspielen und ob es Deckeneffekte gibt (viele 100%-Werte).


Der Bereich in dem sich die Werte bewegen liegt zwischen ca. 15 - 75%. Eine Vielzahl der Werte, sprich der Mittelwert, liegt um die 60%, aber ja auch einige in Richtung der aktuellen Grenze von 70-75%... Im Histogramm sieht das dann natürlich auch ziemlich rechtslastig aus... Macht das also die Analyse unbrauchbar? :(


PonderStibbons hat geschrieben:Was denn nun? Du schriebst von inhomogenen Varianzen (in Verbindung mit einer unterschiedlichen Stichptrobengröße,
was der eigentliche Knackpunkt ist). Daher schlug ich Welch oder Brown-Forsythe vor, die damit klarkommen.

Und Normalverteilung der Residuen wird NICHT durch eine große Stichprobe sichergestellt. Die bleiben nichtnormal.
Die nichtnormal verteilten Residuen schaden aber nicht dem F-Test, wenn die Stichprobe so wie hier groß genug ist.


Verzeihung, ich meinte natürlich auch Heteroskedastizität, die vorliegt. Ok, aber verstehe.

PonderStibbons hat geschrieben:Ich weiß nicht wie bei Dir Ausreißer definiert sind. Du kannst eine 2. Analyse zur Überprüfung der Robustheit
der Ergebnisse machen unter Weglassen der "Ausreißer" (wenn es nur einige wenige sind). Wenn es aufs selbe
hinausläuft, schön. Wenn nicht, muss man das diskutieren.


Es sind sehr viele. Daher werde ich das ausschließlich so erwähnen in der Analyse, wenn ich nämlich die Ausreißer ausblende komme wieder stets neue dazu.

Danke vorab.

Mit freundlichen Grüßen
Studi-DE
Zuletzt geändert von Studi-DE am Di 2. Jun 2020, 12:18, insgesamt 1-mal geändert.
Studi-DE
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Di 2. Jun 2020, 08:55
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Varianzanalyse möglich wenn Parameter nicht gegeben sind

Beitragvon Studi-DE » Di 2. Jun 2020, 12:13

Studi-DE hat geschrieben:Der Bereich in dem sich die Werte bewegen liegt zwischen ca. 15 - 75%. Eine Vielzahl der Werte liegt um die 60%, aber ja auch einige in Richtung der aktuellen Grenze von 70-75%... Im Histogramm sieht das dann natürlich auch ziemlich rechtslastig aus... Macht das also die Analyse unbrauchbar?


Diese Grenze liegt aber nur vor, da der freie Raum nicht ausgenutzt wird. Theoretisch und praktisch wäre es möglich.
Studi-DE
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Di 2. Jun 2020, 08:55
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Varianzanalyse möglich wenn Parameter nicht gegeben sind

Beitragvon PonderStibbons » Di 2. Jun 2020, 12:18

Im Histogramm sieht das dann natürlich auch ziemlich rechtslastig aus... Macht das also die Analyse unbrauchbar?

Nein.
Es sind sehr viele. Daher werde ich das ausschließlich so erwähnen in der Analyse, wenn ich nämlich die Ausreißer ausblende komme wieder stets neue dazu.

Dann hast Du keine Ausreißer identifiziert, sondern folgst einem Algorithmus Deiner Software,
so wie es sich liest.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11257
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2471 mal in 2455 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Studi-DE

Re: Varianzanalyse möglich wenn Parameter nicht gegeben sind

Beitragvon Studi-DE » Di 2. Jun 2020, 12:22

Herzlichen Dank nochmal für Deinen Support.

Ich werde Deine Anregungen in meiner Analyse beherzigen und würde mich ggf. nochmal melden, wenn es irgendwo hängt.

Einen schönen Tag noch :-)

Mit freundlichen Grüßen
Studi-DE
Studi-DE
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Di 2. Jun 2020, 08:55
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Varianzanalyse möglich wenn Parameter nicht gegeben sind

Beitragvon Studi-DE » Mi 3. Jun 2020, 07:27

Guten Morgen,
Ich muss doch nochmal nachfragen, weil es mir keine Ruhe lässt mit den Ausreißern.
Es ist so, dass ich mir die Ausreißer im Boxplot anzeigen lassen habe und dabei ca. 30 Extremwerte (alle im unteren Prozentbereich) feststellen musste. Das Gesamt-N liegt bei ca. 400 und ich befürchte, dass das ein erheblicher Mangel für die Analyse ist.

Du sagtest ich könnte theoretisch die Analyse einmal mit und einmal ohne Ausreißer durchführen. Das habe ich nun auch gemacht. Die Ausreißer wurden manuell ausgeblendet und das Ergebnis der Welch ANOVA + anschließendem Post-Hoc-Test ist nicht wirklich groß abweichend zum Ergebnis mit Ausreißern. Der Mittelwert ist fast identisch und die Gruppen sind noch immer untereinander verschieden.
Macht die Welch-ANOVA überhaupt Sinn bei dieser „großen Zahl“ an Ausreißern? Sie scheint ja laut Literatur sehr sensibel gegenüber Ausreißern zu sein (wohl nicht in meinem Fall).
Andererseits verfälsche ich doch die Datengrundlage durch das ausblenden der Ausreißer. Das sind eben reale Auslastungswerte, die nicht verfälscht sind, sondern durch beispielsweise kurzfristige Transporte entstanden sind.

Soll ich eventuell ein nicht-parametrisches Verfahren in Betracht ziehen? Fakt ist ich muss eine Analyse machen :?

Danke vorab und ich hoffe das macht alles Sinn was ich da mache...

Mit freundlichen Grüßen
Studi-DE
Studi-DE
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Di 2. Jun 2020, 08:55
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Varianzanalyse möglich wenn Parameter nicht gegeben sind

Beitragvon bele » Mi 3. Jun 2020, 08:21

Deine rechtssteile Verteilung wird der Grund dafür sein, dass die dünner gesähten Datenpunkte bei kleineren Werten im Boxplot als Ausreißer dargestellt werden. Das ist noch lange kein Grund dafür, diese Datenpunkte zu löschen, denn Boxplot und Regression sind zwei verschiedene Dinge.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5773
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1354 mal in 1341 Posts

folgende User möchten sich bei bele bedanken:
Studi-DE

Nächste

Zurück zu Varianzanalysen

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 5 Gäste

cron