Seite 1 von 1

Aufbereitung der Daten für Wilcoxon-Vorzeichen-Rang-Test

BeitragVerfasst: Do 24. Sep 2020, 15:13
von Absurdum
Hallo,

ich möchte vergleichen, ob es bei innerbetrieblichen Lieferzeiten einen signifkanten Unterschied zwischen den Monaten 3-8 in 2018 und 2019 und den gleichen Monaten in 2020 gibt.
Dazu habe ich eine Tabelle mit Zeiten (HH-MM-SS). In einer Spalte stehen die PreCovid19-Zeiteb (Monate 3-8 in 2018 und 2019) und in der anderen Covid19 (Monate 3-8 in 2020).
Ich habe mit der If-Funktion schon die extremen Ausreißer beseitigt. Das keine Normalverteilung vorliegt, möchte ich mit dem Wilcoxon-Vorzeichen-Rang-Test einen nicht-parametrischen Test machen.
Jetzt werden durch die If-Funktion ja immer die gleichen Fälle gestrichen und das ist ja eher kontraproduktiv oder? Beispiel: Ein kompletter Fall wird von der Bewertung ausgeschlossen, weil bei Covid19 die vorgebene Zeit überschritten wird (korrekt), aber dieser Fall steht für die Auswert der anderen Spalte (PreCovid) dann nicht mehr zur Verfügung. Ist das nicht problematisch?

Vielen Dank schonmal!

Re: Aufbereitung der Daten für Wilcoxon-Vorzeichen-Rang-Test

BeitragVerfasst: Do 24. Sep 2020, 15:47
von PonderStibbons
Ich habe mit der If-Funktion schon die extremen Ausreißer beseitigt.

Wieso das denn, gehören sie nicht zu den Daten?

Um was für Daten handelt es sich überhaupt? n Vorgänge, jeweils mit den Attributen "Monat", "Jahr" und "Zeitdauer"?

Wie groß ist dabei die Stichprobe?

Da keine Normalverteilung vorliegt, möchte ich mit dem Wilcoxon-Vorzeichen-Rang-Test einen nicht-parametrischen Test machen.

Welche Beobachtungen sind denn dabei gepaart?

Mit freundlichen Grüßen

PonderStibbons

Re: Aufbereitung der Daten für Wilcoxon-Vorzeichen-Rang-Test

BeitragVerfasst: Do 24. Sep 2020, 15:59
von Absurdum
Danke für die Antwort. Ich versuche es zu präzisieren:

Ausreißer: Die Ausreißer sind auf technische Fehler zurückzuführen, die ich für meine Auswertung nicht mit berechnen will.
Daten: Genau ca. 40000 Fälle mit Stunde, Minute, Sekunde (HH-MM-SS)
Gepaart: Es sind immer wieder die gleichen Menschen und Systeme, die die Lieferung machen. Es sind also immer wieder die gleichen Untersuchungsobjekte.

Re: Aufbereitung der Daten für Wilcoxon-Vorzeichen-Rang-Test

BeitragVerfasst: Do 24. Sep 2020, 16:51
von PonderStibbons
Paarweise Vergleiche sind möglich, wenn die Beobachtungsobjekte, die Fälle also,
gepaart sind. Fälle sind hier die 40.000 Liefervorgänge. Ich erkenne nicht, wieso
diese gepaart sein sollen.

Man könnte an eine zweifaktorielle Varianzanalyse mit den beiden Faktoren "Jahr"
und zusätzlich "Zeitabschnitt" (z.B. Monat) denken, letzteres um gegebenenfalls
Saisonalitäten zu berücksichtigen und ob der Coronaeffekt in den betrachteten
Monaten unterschiedlich stark war (Wechselwirkung Monat*Jahr). Wenn man das
nicht möchte, geht vielleicht auch einfach ein t-Test (Welch-Test) mit n=40.000
und der Gruppierungsvariable "Jahr". Zudem sollte man sich auch mal ansehen,
ob die Streuung der Lieferzeiten in dem einen Jahr größer als im anderen war.

Normalverteilung innerhalb der Gruppen beim t-Test bzw. bei der Varianzanalyse
eine Normalverteilung der Residuen ist hier irrelevant, da die Stichprobe ausreichend
groß ist.

Aber eigentlich kann man sich bei derart großen Stichproben Signifikanztests sparen,
die Standardfehler sind dabei winzig. Eine erschöpfende explorative Datenanalyse
bzw. Deskriptivstatistik ist da normalerweise mehr als ausreichend.

Mit freundlichen Grüßen

PonderStibbons