Seite 1 von 1

Vergleich von Häufigkeitsverteilungen in zwei Zeiträumen

BeitragVerfasst: Do 29. Apr 2021, 14:00
von istudy
Hallo zusammen :)
Ich möchte gerne folgende Fragen beantworten:

1. Wird in einem bestimmten Zeitraum signifikant mehr zu einem bestimmten Thema (von insgesamt 6 Themen) berichtet als im Zeitraum davor?
2. Erhält ein bestimmtes Thema (von insgesamt 6 Themen) in einem bestimmten Zeitraum signifikant mehr Kommentare als im Zeitraum davor?

Ich habe dazu zwei Zeiträume definiert und jeweils ausgewertet, wie häufig zu verschiedenen Themen berichtet wird. Zudem habe ich die Anzahl an Kommentaren zu den verschiedenen Themen ermittelt. Ich möchte nun insbesondere herausfinden, ob eines der Themen im zweiten Zeitraum signifikant mehr Beachtung/Kommentare erhält als im ersten Zeitraum. Wie gehe ich hier am besten vor? Bei der ersten Frage weiss ich, dass der prozentuale Anteil der Berichte zu dem Thema ansteigt. Wie weiss ich nun aber, ob dieser Anstieg signifikant ist?
Bei der zweiten Frage habe ich bereits die Anzahl Kommentare als AV von den Themen berechnet. Wie finde ich nun heraus, ob sich die Anzahl Kommentare für ein bestimmtes Thema im neuen Zeitraum signifikant verändert?

Bin froh um jeden Input, weiss leider gerade nicht mehr weiter :-(

Re: Vergleich von Häufigkeitsverteilungen in zwei Zeiträumen

BeitragVerfasst: Do 29. Apr 2021, 14:30
von strukturmarionette
Hi,

- N?
- Wie entstehen deine Messungen?
- Zielpopulation?

Gruß
S.

Re: Vergleich von Häufigkeitsverteilungen in zwei Zeiträumen

BeitragVerfasst: Do 29. Apr 2021, 14:53
von istudy
Hi und Danke für die schnelle Antwort!

N= Ca 500 Beiträge
Es handelt sich um eine manuelle Gesamterhebung aller Beiträge. Diese wurden nach verschiedenen Themen codiert. Zudem wurden die Anzahl Kommentare pro Thema erfasst. Reicht das als Angabe? Oder meinst du etwas anderes?

Re: Vergleich von Häufigkeitsverteilungen in zwei Zeiträumen

BeitragVerfasst: Do 29. Apr 2021, 15:12
von bele
Hallo istudy,

istudy hat geschrieben:1. Wird in einem bestimmten Zeitraum signifikant mehr zu einem bestimmten Thema (von insgesamt 6 Themen) berichtet als im Zeitraum davor?
2. Erhält ein bestimmtes Thema (von insgesamt 6 Themen) in einem bestimmten Zeitraum signifikant mehr Kommentare als im Zeitraum davor?


Wenn ich die Aufgabe richtig verstehe, dann ist es völlig egal, ob es ein Thema aus einem Thema, aus 6 Themen oder aus 12 Themen ist. Vielleicht verstehe ich die Aufgabe aber auch falsch. In dem Fall hättest Du sie wohl doch zu sehr verkürzt dargestellt.

Bei der ersten Frage weiss ich, dass der prozentuale Anteil der Berichte zu dem Thema ansteigt.


Huch, wo kommt denn auf einmal das Prozentual her? Stand vorher irgendwo, dass es um prozentuale Häufigkeiten geht?

Daraus folgt erstens, dass Du nochmal über eine verständliche Darstellung des Problems nachdenken solltest. Zweitens habe ich in einem anderen Forum mal was geschrieben, was hier ungefähr genauso gilt: http://forum.r-statistik.de/viewtopic.php?f=20&t=35 Vor allem Punkt 4 könnte relevant sein.

Viel Erfolg,
Bernhard

Re: Vergleich von Häufigkeitsverteilungen in zwei Zeiträumen

BeitragVerfasst: Do 29. Apr 2021, 15:29
von istudy
Hallo Bernhard

Vielen Dank für deine Antwort! Da hätte ich meine Fragen wohl etwas besser formulieren können. Du hast recht: es spielt einerseits keine Rolle, wie viele Themen insgesamt codiert wurden. Mich interessiert lediglich, ob im zweiten Zeitraum signifikant mehr zu einem Thema berichtet wird.

Ich möchte mir gleichzeitig aber auch anschauen, wie sich der prozentuale Anteil an der Gesamtberichterstattung von diesem Thema ändert. Also ob sich hier eine signifikante Veränderung zeigt und das Thema im zweiten Zeitraum an Bedeutung gewinnt (im Vergleich zu den anderen Themen). Ist meine Frage nun verständlicher?

Re: Vergleich von Häufigkeitsverteilungen in zwei Zeiträumen

BeitragVerfasst: Do 29. Apr 2021, 15:43
von PonderStibbons
Kannst Du bitte das ständige "signifikant" weglassen? Da Du damit offensichtlich inferenzstatistisch signifikant meinst,
das gehört nicht in die wissenschaftliche Fragestellung, das ist ein Mittel zum Zweck.

Es ist leider immer noch nicht ersichtlich, ob in den beiden Zeiträumen unterschiedlich viele Berichte
analysiert wurden. Wenn ich mir das Design zusammenreime, dann wäre plausibel anzunehmen, dass es
n1 Berichte in der ersten Phase und n2 Berichte in der zweiten Phase gab, und zu jedem Bericht ein Messwert
"Thema X kam vor" versus "Thema X kam nicht vor" vorliegt. Das wäre ein Fall für eine Kreuztabelle
Phase (1 vs.2) * Thema X (ja vs nein) mit Chi²-Test. Kann aber sein, dass ich falsch liege, da ich raten musste.

Mit freundlichen Grüßen

PonderStibbons

Re: Vergleich von Häufigkeitsverteilungen in zwei Zeiträumen

BeitragVerfasst: Do 29. Apr 2021, 15:51
von bele
PonderStibbons hat geschrieben:Kann aber sein, dass ich falsch liege, da ich raten musste.


Könnte beispielsweise auch sein dass jemand auf Twitter beobachtet hat, wie oft irgendein Mensch etwas zum Thema Federkernmatratze geschrieben hat. Dann ginge es nur um bloße Anzahlen die keinen Anteilswert an einem Gesamtwert haben und dann könnte man keine Kreuztabelle erstellen und dann fiele der Chi²-Unabhängigkeitstest von PonderStibbons aus.
Wenn man dann wüsste, das eine Übungsaufgabe kurz nachdem die Poisson-Verteilung durchgenommen wurde...

Ist meine Frage nun verständlicher?


Nicht verständlich genug. Vielleicht hilft neben PonderStibbons Erklärung etwas hiervon: nutzung-des-forums-f44/das-musste-mal-gepostet-werden-t6682.html

LG,
Bernhard

Re: Vergleich von Häufigkeitsverteilungen in zwei Zeiträumen

BeitragVerfasst: Do 29. Apr 2021, 15:53
von istudy
Ok, lass ich weg, Danke für den Hinweis :).

Und nein, die Anzahl ist nicht exakt identisch in den beiden Zeiträumen. Aber annähernd. Deshalb auch die Angabe in Prozent am Gesamtumfang. Es handelt sich um eine kategoriale Variable, wobei jeder Beitrag einem Thema zugeordnet wurde. Hoffe, diese Information macht meine Frage verständlicher!

Re: Vergleich von Häufigkeitsverteilungen in zwei Zeiträumen

BeitragVerfasst: Do 29. Apr 2021, 16:23
von strukturmarionette
Hi,

- ohne etwas falsch zu machen, könntest du zunächst deine Anzahlen kreuztabellarisch zusammenfassen.
- so viele Kreuztabellen, wie du konkret Fragestellungen hat
- je nachdem, um was es fachlich geht, könnten dann weitere Überlegungen gemacht werden

Gruß
S.