Raw vs. Smoothed Data

Fragen, die sich auf kein spezielles Verfahren beziehen.

Raw vs. Smoothed Data

Beitragvon spsshelh » Mi 22. Sep 2021, 12:42

Hallo, ich wollte mir einmal die COVID Daten anschauen und ein paar Auswertungen vornehmen.
Um den Datensatz übersichtlicher zu machen, möchte ich mich hierbei an bestimmte Zeitpunkte richten, bspw. 01.03.2020, 01.06.2020, 01.09.2020, usw. Todes- und Fallzahlen und Mortalität beziehen sich also jeweils auf diese Zeitpunkte. Diese würde ich gerne mit statischen/gleichbleibenden Variablen wie bspw. Anzahl der RaucherInnen korrelieren.
Bis jetzt habe ich hier immer die raw Data verwendet, bin mir aber mittlerweile nicht sicher, ob die smoothed Data dafür nicht besser geeignet wären.
Nach längerer Eigenrecherche ist es mir immer noch nicht schlüssig.
Bin dankbar für jede Hilfe!
spsshelh
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Mi 24. Feb 2021, 18:16
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Raw vs. Smoothed Data

Beitragvon strukturmarionette » Mi 22. Sep 2021, 13:18

Hi,

- ob du die gesamte Stichprobe auswertest oder nur einige Zeitpunkte daraus, wäre abhängig von deiner Fragstellung zu entscheiden
- damit wäre also zu beginnen ( konkrete Fragestellung(en) )

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4312
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 582 mal in 579 Posts

folgende User möchten sich bei strukturmarionette bedanken:
spsshelh

Re: Raw vs. Smoothed Data

Beitragvon spsshelh » Mi 22. Sep 2021, 13:44

strukturmarionette hat geschrieben: die gesamte Stichprobe auswertest oder nur einige Zeitpunkte daraus


Ich würde gerne verschiedene Länder herannehmen (Deutschland, Österreich, Frankreich, Uk,...) und jeweils die Todeszahlen und Fallzahlen für den 01.03., den 01.06.,... für alle Länder auswählen. Hierbei weiß ich nicht ob ich die raw oder smooth Data verwenden soll. Die Zahlen zu Anzahl der Raucher bleiben über den Zeitraum hinweg gleich, da diese im Jahr 2020 nicht erneut berechnet wurden.

Eine Beispielfrage wäre dann ob die Anzahl der RaucherInnen Einfluss auf den Verlauf der Pandemie hatten.
spsshelh
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Mi 24. Feb 2021, 18:16
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Raw vs. Smoothed Data

Beitragvon PonderStibbons » Mi 22. Sep 2021, 14:19

Eine Beispielfrage wäre dann ob die Anzahl der RaucherInnen Einfluss auf den Verlauf der Pandemie hatten.

Wie willst Du das denn anhand der vorhandenen Daten konkret analysieren, ob nun Rohdaten oder geglättete?
Und wie kommt es zu dem Begriff "Einfluss"; dass die Zahl bzw. Rate der Raucher mit vielen weiteren Faktoren
konfundiert ist, die mit dem Verlauf assoziiert sind, liegt auf der Hand. Da sind kausale Begriffe schnell irreführend.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11226
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2466 mal in 2450 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste