Seite 1 von 1

Raw vs. Smoothed Data

BeitragVerfasst: Mi 22. Sep 2021, 12:42
von spsshelh
Hallo, ich wollte mir einmal die COVID Daten anschauen und ein paar Auswertungen vornehmen.
Um den Datensatz übersichtlicher zu machen, möchte ich mich hierbei an bestimmte Zeitpunkte richten, bspw. 01.03.2020, 01.06.2020, 01.09.2020, usw. Todes- und Fallzahlen und Mortalität beziehen sich also jeweils auf diese Zeitpunkte. Diese würde ich gerne mit statischen/gleichbleibenden Variablen wie bspw. Anzahl der RaucherInnen korrelieren.
Bis jetzt habe ich hier immer die raw Data verwendet, bin mir aber mittlerweile nicht sicher, ob die smoothed Data dafür nicht besser geeignet wären.
Nach längerer Eigenrecherche ist es mir immer noch nicht schlüssig.
Bin dankbar für jede Hilfe!

Re: Raw vs. Smoothed Data

BeitragVerfasst: Mi 22. Sep 2021, 13:18
von strukturmarionette
Hi,

- ob du die gesamte Stichprobe auswertest oder nur einige Zeitpunkte daraus, wäre abhängig von deiner Fragstellung zu entscheiden
- damit wäre also zu beginnen ( konkrete Fragestellung(en) )

Gruß
S.

Re: Raw vs. Smoothed Data

BeitragVerfasst: Mi 22. Sep 2021, 13:44
von spsshelh
strukturmarionette hat geschrieben: die gesamte Stichprobe auswertest oder nur einige Zeitpunkte daraus


Ich würde gerne verschiedene Länder herannehmen (Deutschland, Österreich, Frankreich, Uk,...) und jeweils die Todeszahlen und Fallzahlen für den 01.03., den 01.06.,... für alle Länder auswählen. Hierbei weiß ich nicht ob ich die raw oder smooth Data verwenden soll. Die Zahlen zu Anzahl der Raucher bleiben über den Zeitraum hinweg gleich, da diese im Jahr 2020 nicht erneut berechnet wurden.

Eine Beispielfrage wäre dann ob die Anzahl der RaucherInnen Einfluss auf den Verlauf der Pandemie hatten.

Re: Raw vs. Smoothed Data

BeitragVerfasst: Mi 22. Sep 2021, 14:19
von PonderStibbons
Eine Beispielfrage wäre dann ob die Anzahl der RaucherInnen Einfluss auf den Verlauf der Pandemie hatten.

Wie willst Du das denn anhand der vorhandenen Daten konkret analysieren, ob nun Rohdaten oder geglättete?
Und wie kommt es zu dem Begriff "Einfluss"; dass die Zahl bzw. Rate der Raucher mit vielen weiteren Faktoren
konfundiert ist, die mit dem Verlauf assoziiert sind, liegt auf der Hand. Da sind kausale Begriffe schnell irreführend.

Mit freundlichen Grüßen

PonderStibbons