Seite 1 von 2

Interpretation ANOVA Wochentag - Periode

BeitragVerfasst: Mo 11. Dez 2017, 12:23
von bloom
Hallo zusammen,

ich habe für meine Untersuchung folgende Thesen aufgestellt:

H0 Der präferierte WOCHENTAG unterscheidet sich nicht zwischen den Perioden
H1 Der präferierte WOCHENTAG unterscheidet sich zwischen den Perioden.

Hierfür habe ich folgende Matrix angelegt:
A B C D E
Montag 138 35 45 47 70
Dienstag 159 69 45 53 62
Mittwoch 129 56 56 49 74
Donnerstag 172 45 56 54 79
Freitag 75 57 57 39 81
Samstag 99 41 54 31 92
Sonntag 92 58 36 40 45

Testverfahren: Anova: Zweifaktorielle Varianzanalyse ohne Messwiederholung

Für den Wochentag habe ich einen p-Wert von 0,2808
und für die Periode 0,0000001002

In der Interpretation würde das ja bedeuten, dass ich eine Abweichung zwischen den Perioden, nicht aber zwischen den Wochentagen vorliegen habe.
In meiner These will ich jedoch nachweisen in wie weit sich der präferierte Wochentag zwischen den Perioden geändert hat.

Habe ich einen Fehler in der Interpretation oder im Testverfahren gemacht?

Lieben Dank und viele Grüße,
bloom

Re: Interpretation ANOVA Wochentag - Periode

BeitragVerfasst: Mo 11. Dez 2017, 13:14
von PonderStibbons
H0 Der präferierte WOCHENTAG unterscheidet sich nicht zwischen den Perioden

Das ist keine statistische Nullhypothese. Zum Beispiel ist der Parameter nicht genannt. Eine statistsiche Nullhypothese ist etwas des Typs "der Mittelwert der Variable XY in Gruppe A ist gleich dem Mittelwert in Gruppe B" oder "der Anteil der Männer an allen Teilnehmenden ist über die 5 betrachteten Jahre konstant".
Hierfür habe ich folgende Matrix angelegt:

Was ist das für eine Untersuchung (Thema, Fragestellung, Variablen, Erhebungsdesign, Stichprobengröße, statistische Analysemethode)?

Mit freundlichen Grüßen

PonderStibbons

Re: Interpretation ANOVA Wochentag - Periode

BeitragVerfasst: Mo 11. Dez 2017, 13:27
von bloom
Hallo,

vielen Dank für die schnelle Rückantwort.
Ich analysiere einen Twitter Account und habe dafür 3200 Tweets exportiert.
Die Fragestellung bezieht sich auf verändertes Twitter Verhalten zwischen festgelegten Perioden.
Die Hypothese zu den Wochentagen ist in sofern nur eine Unterhypothese um den Parameter „Wochentag“ zu testen.
Ich möchte nachweisen dass sich der präferierte Wochentag für Tweets (Anzahl Tweets nach Wochentag) geändert hat.

Beste Grüße

Re: Interpretation ANOVA Wochentag - Periode

BeitragVerfasst: Mo 11. Dez 2017, 15:30
von PonderStibbons
Was für tweets, immer von derselben Person? Was für Perioden, immer gleich lang? Wie viele Perioden, sollte das mit ABCDE gemeint sein?
Testverfahren: Anova: Zweifaktorielle Varianzanalyse ohne Messwiederholung

Wie sah die denn konkret aus, was waren da die Faktoren und was die Probanden und welches die abhängige Variable?

Mit freundlichen Grüßen

PonderStibbons

Re: Interpretation ANOVA Wochentag - Periode

BeitragVerfasst: Mo 11. Dez 2017, 16:22
von bloom
Tweets einer Person, Perioden alle gleich lang (73 Tage, 1 Jahr Betrachtungszeitraum), die Perioden sind mit ABCDE benannt.
Ich habe die Analyse "nur" anhand der Matrix Wochentag - Periode durchgeführt (siehe oben). Es fällt mir leider schwer festzulegen was da die unabhängie und abhängige Variable ist. Ich will ja aufzeigen, wie sich die Anzahl der Tweets an den einzelnen Wochentagen zwischen den Perioden verändert hat. Also sind die Wochentage abhängig und die Perioden unabhängig?

Lieben Dank und beste Grüße

Re: Interpretation ANOVA Wochentag - Periode

BeitragVerfasst: Mo 11. Dez 2017, 16:40
von PonderStibbons
Mit Varianzanalyse hat das nichts zu tun.
Es liegen n Tweets vor. Diese Verteilen sich auf 7 Wochentage bzw. 5 Perioden.
Das ergibt also eine 5x7-Kreuztabelle.

Die globale Frage wäre zunächst, ob sich die Verteilung der Tweets auf die Wochentage
zwischen den Perioden überhaupt unterscheidet. Das geht mit einem Chi²-Test. Sollte der
ein statiistisch signifikantes Ergebnis zeigen, könnte man spezifischere Betrachtungen
anschließen. Zum Beispiel paarweise Vergleiche zwischen Perioden (2x7-Kreuztabellen),
wobei ich nicht weiß, ob alle 10 Paarvergleiche hier der Fragestellung entsprechen
würden oder nur eine bestimmte Auswahl der möglichen Paarvergleiche.

Mit freundlichen Grüßen

PonderStibbons

Re: Interpretation ANOVA Wochentag - Periode

BeitragVerfasst: Mo 11. Dez 2017, 16:47
von bele
PonderStibbons hat geschrieben:Die globale Frage wäre zunächst, ob sich die Verteilung der Tweets auf die Wochentage
zwischen den Perioden überhaupt unterscheidet. Das geht mit einem Chi²-Test. Sollte der
ein statiistisch signifikantes Ergebnis zeigen, ...


Code: Alles auswählen
> tag <- scan()
1: 138 35 45 47 70
6: 159 69 45 53 62
11: 129 56 56 49 74
16: 172 45 56 54 79
21: 75 57 57 39 81
26: 99 41 54 31 92
31: 92 58 36 40 45
36:
Read 35 items
> tag.m <- matrix(tag, ncol=5, nrow=7, byrow=TRUE)
> tag.m
     [,1] [,2] [,3] [,4] [,5]
[1,]  138   35   45   47   70
[2,]  159   69   45   53   62
[3,]  129   56   56   49   74
[4,]  172   45   56   54   79
[5,]   75   57   57   39   81
[6,]   99   41   54   31   92
[7,]   92   58   36   40   45
> chisq.test(tag.m)

   Pearson's Chi-squared test

data:  tag.m
X-squared = 77.993, df = 24, p-value = 1.266e-07


Jep, ist signifikant mit seeeehr kleinem p. Das hält auch noch ein wenig Bonferroni-Korrektur aus. Man darf also gerne weiter machen.

LG,
Bernhard

Re: Interpretation ANOVA Wochentag - Periode

BeitragVerfasst: Mo 11. Dez 2017, 17:09
von bloom
Erst einmal vielen Dank für die Hilfestellung - das bringt mich wirklich weiter. Danke!

Wie lässt sich das p aus dem Chi-Test interpretieren? Es gibt eine signifikante Änderung der Wochentage zwischen den Perioden? Wie finde ich heraus um welchen Wochentag es sich handelt?

Lieben Dank

Re: Interpretation ANOVA Wochentag - Periode

BeitragVerfasst: Mo 11. Dez 2017, 17:35
von PonderStibbons
Die Tweets verteilen sich je nach Periode unterschiedlich über die Wochentage.
Man könnte Annäherungsweise die standardisierten Residuen fü die Zellen
berechnen. Das sind Werte die angeben, wie weit eine Zellenbesetzung postitiv
bzw. negativ abweicht von der Zellenbesetzung, die bei gleicher Verteilung
zu erwarten wäre. Ein Wert > 1,96 oder < 1,96 kann man als "signifikante"
Abweichung interpretieren. Könnte bei einer 5x7-Tabelle eventuell unübersichtlich
werden.

Mit freundlichen Grüßen

PonderStibbons

Re: Interpretation ANOVA Wochentag - Periode

BeitragVerfasst: Mo 11. Dez 2017, 17:44
von bele
Da ich R gerade noch offen habe und die Daten nun schon einmal eingelesen sind und ich dieses Vorgehen bislang nicht kenne, habe ich in der R Anleitung folgende zwei Varianten gefunden:

Code: Alles auswählen
residuals
the Pearson residuals, (observed - expected) / sqrt(expected).

stdres
standardized residuals, (observed - expected) / sqrt(V), where V is the residual cell variance (Agresti, 2007, section 2.4.5 for the case where x is a matrix, n * p * (1 - p) otherwise).


Die Pearson residuals verhalten sich so:
Code: Alles auswählen
> round( chisq.test(tag.m)$residuals, 2)
      [,1]  [,2]  [,3]  [,4]  [,5]
[1,]  1.54 -2.19 -0.56  0.47 -0.06
[2,]  1.58  1.36 -1.55  0.31 -2.18
[3,] -0.23  0.14  0.39  0.19 -0.30
[4,]  2.08 -2.08 -0.43  0.11 -0.70
[5,] -3.47  1.51  1.77 -0.23  1.98
[6,] -1.46 -0.99  1.13 -1.63  3.10
[7,] -0.60  2.67 -0.57  0.76 -1.59
>
> abs( chisq.test(tag.m)$residuals) > 1.96
      [,1]  [,2]  [,3]  [,4]  [,5]
[1,] FALSE  TRUE FALSE FALSE FALSE
[2,] FALSE FALSE FALSE FALSE  TRUE
[3,] FALSE FALSE FALSE FALSE FALSE
[4,]  TRUE  TRUE FALSE FALSE FALSE
[5,]  TRUE FALSE FALSE FALSE  TRUE
[6,] FALSE FALSE FALSE FALSE  TRUE
[7,] FALSE  TRUE FALSE FALSE FALSE


Die nachgenannten "standardisierten" verhalten sich so:

Code: Alles auswählen
> round( chisq.test(tag.m)$stdres, 2)
      [,1]  [,2]  [,3]  [,4]  [,5]
[1,]  2.07 -2.57 -0.65  0.55 -0.07
[2,]  2.16  1.61 -1.83  0.36 -2.68
[3,] -0.31  0.16  0.46  0.22 -0.36
[4,]  2.86 -2.48 -0.51  0.13 -0.86
[5,] -4.66  1.76  2.05 -0.27  2.39
[6,] -1.96 -1.16  1.32 -1.88  3.74
[7,] -0.80  3.07 -0.65  0.86 -1.90
> abs( chisq.test(tag.m)$stdres) > 1.96
      [,1]  [,2]  [,3]  [,4]  [,5]
[1,]  TRUE  TRUE FALSE FALSE FALSE
[2,]  TRUE FALSE FALSE FALSE  TRUE
[3,] FALSE FALSE FALSE FALSE FALSE
[4,]  TRUE  TRUE FALSE FALSE FALSE
[5,]  TRUE FALSE  TRUE FALSE  TRUE
[6,] FALSE FALSE FALSE FALSE  TRUE
[7,] FALSE  TRUE FALSE FALSE FALSE


Ich glaube, letzteres ist das, was Du empfohlen hast?

LG,
Bernhard