Aufbereitung der Daten für Wilcoxon-Vorzeichen-Rang-Test

Aufbereitung der Daten für Wilcoxon-Vorzeichen-Rang-Test

Beitragvon Absurdum » Do 24. Sep 2020, 15:13

Hallo,

ich möchte vergleichen, ob es bei innerbetrieblichen Lieferzeiten einen signifkanten Unterschied zwischen den Monaten 3-8 in 2018 und 2019 und den gleichen Monaten in 2020 gibt.
Dazu habe ich eine Tabelle mit Zeiten (HH-MM-SS). In einer Spalte stehen die PreCovid19-Zeiteb (Monate 3-8 in 2018 und 2019) und in der anderen Covid19 (Monate 3-8 in 2020).
Ich habe mit der If-Funktion schon die extremen Ausreißer beseitigt. Das keine Normalverteilung vorliegt, möchte ich mit dem Wilcoxon-Vorzeichen-Rang-Test einen nicht-parametrischen Test machen.
Jetzt werden durch die If-Funktion ja immer die gleichen Fälle gestrichen und das ist ja eher kontraproduktiv oder? Beispiel: Ein kompletter Fall wird von der Bewertung ausgeschlossen, weil bei Covid19 die vorgebene Zeit überschritten wird (korrekt), aber dieser Fall steht für die Auswert der anderen Spalte (PreCovid) dann nicht mehr zur Verfügung. Ist das nicht problematisch?

Vielen Dank schonmal!
Absurdum
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Do 4. Jun 2020, 22:38
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Aufbereitung der Daten für Wilcoxon-Vorzeichen-Rang-Test

Beitragvon PonderStibbons » Do 24. Sep 2020, 15:47

Ich habe mit der If-Funktion schon die extremen Ausreißer beseitigt.

Wieso das denn, gehören sie nicht zu den Daten?

Um was für Daten handelt es sich überhaupt? n Vorgänge, jeweils mit den Attributen "Monat", "Jahr" und "Zeitdauer"?

Wie groß ist dabei die Stichprobe?

Da keine Normalverteilung vorliegt, möchte ich mit dem Wilcoxon-Vorzeichen-Rang-Test einen nicht-parametrischen Test machen.

Welche Beobachtungen sind denn dabei gepaart?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 8939
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 30
Danke bekommen: 1865 mal in 1852 Posts

Re: Aufbereitung der Daten für Wilcoxon-Vorzeichen-Rang-Test

Beitragvon Absurdum » Do 24. Sep 2020, 15:59

Danke für die Antwort. Ich versuche es zu präzisieren:

Ausreißer: Die Ausreißer sind auf technische Fehler zurückzuführen, die ich für meine Auswertung nicht mit berechnen will.
Daten: Genau ca. 40000 Fälle mit Stunde, Minute, Sekunde (HH-MM-SS)
Gepaart: Es sind immer wieder die gleichen Menschen und Systeme, die die Lieferung machen. Es sind also immer wieder die gleichen Untersuchungsobjekte.
Absurdum
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Do 4. Jun 2020, 22:38
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Aufbereitung der Daten für Wilcoxon-Vorzeichen-Rang-Test

Beitragvon PonderStibbons » Do 24. Sep 2020, 16:51

Paarweise Vergleiche sind möglich, wenn die Beobachtungsobjekte, die Fälle also,
gepaart sind. Fälle sind hier die 40.000 Liefervorgänge. Ich erkenne nicht, wieso
diese gepaart sein sollen.

Man könnte an eine zweifaktorielle Varianzanalyse mit den beiden Faktoren "Jahr"
und zusätzlich "Zeitabschnitt" (z.B. Monat) denken, letzteres um gegebenenfalls
Saisonalitäten zu berücksichtigen und ob der Coronaeffekt in den betrachteten
Monaten unterschiedlich stark war (Wechselwirkung Monat*Jahr). Wenn man das
nicht möchte, geht vielleicht auch einfach ein t-Test (Welch-Test) mit n=40.000
und der Gruppierungsvariable "Jahr". Zudem sollte man sich auch mal ansehen,
ob die Streuung der Lieferzeiten in dem einen Jahr größer als im anderen war.

Normalverteilung innerhalb der Gruppen beim t-Test bzw. bei der Varianzanalyse
eine Normalverteilung der Residuen ist hier irrelevant, da die Stichprobe ausreichend
groß ist.

Aber eigentlich kann man sich bei derart großen Stichproben Signifikanztests sparen,
die Standardfehler sind dabei winzig. Eine erschöpfende explorative Datenanalyse
bzw. Deskriptivstatistik ist da normalerweise mehr als ausreichend.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 8939
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 30
Danke bekommen: 1865 mal in 1852 Posts


Zurück zu Nichtparametrische Tests

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast