Signifikanz von Ergebnissen

Univariate Statistik.

Signifikanz von Ergebnissen

Beitragvon bocholt_1983 » Mi 18. Jul 2012, 09:26

Hallo zusammen,

folgendes Problem:

Ich muss eine Aufgabe lösen, wo es um unterschiedliche Beleuchtungsszenarien geht. Es gibt immer einen Tag mit "normalem" Licht (Referenz) und einen, den darauffolgenden, Tag mit "optimiertem" Licht. Also z.B. montags: normal, dienstags: optmiert, mittwoch: normal, usw. und in der nächsten Woche dann genau andersherum (montags: optimiert usw.). Es soll u.a. der Umsatz und Absatz analysiert werden. Hier nehme ich jetzt einmal die Kategorie Salat und den Absatz als Beispiel.

Es gibt folgende Produkte mit folgendem Absatz in der Kategorie:

Salat A : 926; 1.027
Salat B: 371; 370
Salat C: 40; 53
Salat D: 151; 209
Salat E: 59; 66
Salat F: 49; 65
Salat G: 13; 7
Salat H: 10; 28
Salat I: 40; 20
Salat J: 306; 336
Salat K: 51; 57
Salat L: 104; 79

In der linken Spalte sieht man den jeweiligen Totalabsatz bei Referenzlicht und in der rechten Spalte den Totalabsatz bei optimiertem Licht (Grundlage des Tests sind 16 Kalendarwochen. Es gab also 16 Wochen mit je 3 Tagen Referenz bzw. optimiertem Licht pro Woche - die maximal zugrundeliegende Anzahl an Tagen beträgt also 48).

Total ergibt sich also für das Referenzlicht eine Summe von 2121 und für das optimierte Licht eine Summe von 2317. Setzt man das ins Verhältnis, dann sieht man, dass an den optimierten Tagen bei Salat 9.27% mehr abgesetzt werden. Es ist jetzt zu beantworten, wie sicher die Ergebnisse sind und ob die Prozentwerte außerhalb der Standardabweichung liegen. Ich weiß da ehrlichgesagt nicht, was ich machen soll. Habe einmal den Mittelwert für optimiertes und für Referenzlicht berechnet, dann die Standardabweichung und dann hab ich die prozentuale Abweichung der beiden Standardabweichungen berechnet und geschaut, ob der Wert von 9.27% innerhalb der Standardabweichung liegt oder außerhalb. Ist das richtig/falsch?

Desweiteren habe ich - auf Produktebene - f-tests durchgeführt (auf Produktebene, weil es je Kategorie nur einige wichtige Produkte gibt. Also solche die einen hohen MA haben und auch fast durchgängig gelistet waren. Produkte, die vllt 2% der Kategorie ausmachen und nur 4 von 16 Wochen gelistet waren, habe ich nicht betrachtet). Also z.B. für Salat B habe ich mir die Absatzzahlen pro Tag angesehen und dann nach optimiert und referenz gesplittet. Habe dann Mittelwerte für optimiert und referenz berechnet, varianz, standardabw. und dann f-test. irgendwie kam da für jedes Produkt, was irgendeine Relevanz auf die Kategorie hätte heraus, dass die Prüfgröße kleiner ist als der f-Wert. Somit unterscheiden sich die Varianzen nur zufällig und es gibt keinen signifikanten Unterschied. Heißt das dann, dass die prozentuale Differenz zw. optimierten und Referenztagen bei Kopfsalat im Konkreten nicht signifikant ist? Habe das ja nur auf Produktebene gemacht, daher hat das eigentlich nichts mit der Überprüfung der 9.27% die ich oben berechnet habe zu tun, dachte aber, dass das vllt auch irgendwie helfen kann.

Es wäre wirklich ganz toll, wenn mir jemand kurz weiterhelfen könnte - stehe auf dem Schlauch :-)

Herzlichen Dank & viele Grüße
bocholt_1983
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Mi 18. Jul 2012, 09:18
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Signifikanz von Ergebnissen

Beitragvon bele » Mi 18. Jul 2012, 09:43

Wilcoxon-Test für verbundene Stichproben?

Code: Alles auswählen
> RefLicht = c( 926, 371,  40, 151, 59, 49, 13,10, 40, 306, 51, 104)
> OptLicht = c( 1027 , 370, 53, 209, 66, 65, 7, 28, 20, 336, 57, 79)
> wilcox.test(RefLicht, OptLicht, paired=TRUE)

        Wilcoxon signed rank test with continuity correction

data:  RefLicht and OptLicht
V = 20.5, p-value = 0.1578
alternative hypothesis: true location shift is not equal to 0

Warnmeldung:
In wilcox.test.default(RefLicht, OptLicht, paired = TRUE) :
  kann bei Bindungen keinen exakten p-Wert Berechnen
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5780
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1357 mal in 1344 Posts

Re: Signifikanz von Ergebnissen

Beitragvon bocholt_1983 » Mi 18. Jul 2012, 14:32

Hi,

erstmal danke für die Antwort.
Hatte im Studium Statistk und hab ehrlichgesagt nie von diesem Test gehört. Was führt dazu, dass Du ihn anwendest? Gibt es keine Alternativen bspw. über die Standardabweichung bzw. über einen f-test?

Viele Grüße
bocholt_1983
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Mi 18. Jul 2012, 09:18
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Signifikanz von Ergebnissen

Beitragvon bele » Mi 18. Jul 2012, 16:17

Hi,

Statistik ist ein großes Feld - je nachdem wer da was lehrt gibt es sehr unterschiedliche Schwerpunkte. Hast Du von der Unterteilung in parametrische versus nicht-parametrische Tests gehört? Jedenfalls ist der F-Test unter gewissen Normalverteilungsannahmen anwendbar, und ich bezweifle, dass bei Deinen 12 verschiedenen Salatsorten irgendeine Normalverteilungsannahmen zu begründen sind. Wenn doch, dann versuch Dich an einem t-/F-Test.

Gruß,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5780
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1357 mal in 1344 Posts

Re: Signifikanz von Ergebnissen

Beitragvon bocholt_1983 » Do 19. Jul 2012, 14:02

Hallo Bernhard - danke für Deine erneute Antwort :-) - mein BWL-Studium liegt noch nicht soooooo lange zurück, aber Statistik hatte ich (primär) im Grundstudium und war ehrlichgesagt auch ganz froh als ich es dann abgeschlossen hatte. Von parametrischen Testverfahren hab ich zumindest gehört....

Deine Frage nach der Normalverteilung ist durchaus berechtigt. Wenn wir jetzt mal annehmen, die Veteilung ist nv und ich gebe Dir für eine Salatsorte A die Tagesabsätze, ist meine Berechnung dann richtig?

Tagesabsätze Referenzlicht Salat A: 14; 14; 23; 11; 16; 20; 10; 10; 29; 29; 34; 51; 7; 12; 18; 18; 14; 23; 18; 11; 36; 10; 10; 12; 15; 14; 20; 10; 15; 20; 19; 20; 18; 0; 12; 34; 18; 18; 29; 20; 24; 33; 16; 20; 33; 12; 20; 36

Tagesabsätze Opt.Licht Salat A: 16; 15; 28; 15; 13; 22; 8; 19; 20; 23; 18; 34; 10; 15; 25; 17; 13; 29; 20; 19; 21; 20; 18; 40; 12; 16; 11; 0; 16; 19; 18; 14; 21; 20; 18; 36; 40; 24; 22; 24; 13; 39; 20; 42; 30; 28; 27; 39

Für Referenzlicht habe ich eine Varianz von 89,23 und für das optimierte Licht eine Varianz von 83,44 errechnet. Die Prüfgröße beträgt somit 1,07 - der F-Wert liegt bei einem Signifikanzniveau von 5% und df1 = n-1 = 47, df2 = n-1 = 47 zwischen 1,61 und 1,67 (habe keine so detaillierte Tabelle und kein entsprechendes Programm). Somit ist die Prüfgröße < F-Wert, die Varianzen unterscheiden sich nur zufällig - die Unterschiede sind NICHT signifkant (Der Unterschied von +9.81% an opt. Tagen mit Salat A ist nicht signifikant). Ist das so einigermaßen nachvollziehbar und besser noch: richtig??? :-)

Habe verschiedene Kategorien in der Betrachtung und schaue mir immer nur die wichtigsten Produkte an. Wenn diese nicht signifikante Unterschiede aufweisen, sollte auch die prozentuale Abweichung der Gesamtkategorie nicht signifikant sein. So zumindest meine These.

Viele Grüße
bocholt_1983
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Mi 18. Jul 2012, 09:18
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Signifikanz von Ergebnissen

Beitragvon bele » Do 19. Jul 2012, 14:54

Hallo Bocholt,

man kann das Problem mehr oder weniger differenziert angehen und wenn man will, kann man eine Statistik-Orgie daraus machen, denn es sind ja immer drei Messpaare die zusammen gehören und über das Jahr hinweg wird die Nachfrage nach Salat A nicht stabil sein so dass immer Triplets der Messungen besonders eng zusammen gehören. Das wird schnell so kompliziert, dass z. B. ich es nicht kann (andere im Forum sicher).
Tun wir einfach so, als ob es sich um 2x48 unabhängige Zufallsstichproben handelte. Tun wir weiter so, also entstammten sie einer Normalverteilung (das geht bei diesen Daten besser als bei den oben genannten), dann wäre der parametrische Test um beide zu vergleichen der t-Test. Ich glaube hier im Forum gelesen zu haben, dass das dem F-Test entspricht. Die nächste Frage ist, ob man Deine Daten als verbundene oder als unverbundene Stichproben ansieht. Gehören der n-te Wert beim Referenzlicht und der n-te Wert beim Optimumlicht zusammen? Beispielsweise weil sie in der gleichen Woche beim gleichen Wetter in der gleichen Jahreszeit gekauft wurden? Ich denke ja, denn Woche, Wetter und Jahreszeit haben Einfluss auf die Salatnachfrage. Also brauchen wir einen t-Test für verbundene Stichproben.

Tests von Hand zu rechnen ist anstrengend, fehlerträchtig und recht rasch unüberschaubar. Es gibt wirklich gute, freie Software dafür. Viele verwenden R, das man von http://www.r-project.org herunterladen kann. In R tippt man Befehle ein, die sich leicht über ein Forum wie dieses austauschen lassen. Beispielsweise:

Code: Alles auswählen
RefSalatA <- c(14, 14, 23, 11, 16, 20, 10, 10, 29, 29, 34, 51, 7,
               12, 18, 18, 14, 23, 18, 11, 36, 10, 10, 12, 15, 14,
               20, 10, 15, 20, 19, 20, 18, 0, 12, 34, 18, 18, 29,
               20, 24, 33, 16, 20, 33, 12, 20, 36)
OptSalatA <- c(16, 15, 28, 15, 13, 22, 8, 19, 20, 23, 18, 34, 10,
               15, 25, 17, 13, 29, 20, 19, 21, 20, 18, 40, 12, 16,
               11, 0, 16, 19, 18, 14, 21, 20, 18, 36, 40, 24, 22, 24,
               13, 39, 20, 42, 30, 28, 27, 39)
t.test(RefSalatA, OptSalatA, paired=TRUE)


Als Ergebnis erhälst Du dann
Code: Alles auswählen
        Paired t-test

data:  RefSalatA and OptSalatA
t = -1.5446, df = 47, p-value = 0.1291
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-4.8446482  0.6363149
sample estimates:
mean of the differences
              -2.104167


Daran kannst Du ablesen, dass der Unterschied zwischen beiden Gruppen zu 95% zwischen -4,84 und 0,63 liegt und mit einem p-Wert von 0,12 nicht signifikant auf 5%-Niveau ist. Um etwaige Rechenfehler musst Du Dir da keine Gedanken machen. Ein weiterer Vorteil der Computerlösung ist, dass Du Deine Daten sehr schnell anschauen kannst. Wenn Du etwa sehen möchtest, wie groß die Differenzen zwischen beiden Varianten sind und wie oft die Differenz positiv oder negativ ist, geht das sehr schnell, z. B.

Code: Alles auswählen
plot(RefSalatA-OptSalatA)
abline(h=0, col="green")


und schaue mir immer nur die wichtigsten Produkte an. Wenn diese nicht signifikante Unterschiede aufweisen, sollte auch die prozentuale Abweichung der Gesamtkategorie nicht signifikant sein.

Ich glaube, das habe ich nicht ganz verstanden. Es scheint aber so, als hättest Du ziemlich mühevoll viele Daten zusammen getragen und als würden die einzelnen Betrachtungen einzelner Kategorien nicht signifikant werden. Das heißt nicht, dass nicht eine multivariate Statistik, die durch Einbeziehen aller gezählten Werte in einen Test ein viel größeres n erreicht, nicht doch signifikant werden könnte. Dann werden die oben erwähnten und vernachlässigten Aspekte aber nicht mehr vernachlässigbar und Du solltest Dir überlegen, ggf. doch eine professionelle Statistikberatung für genau Dein Problem zu bezahlen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5780
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1357 mal in 1344 Posts

Re: Signifikanz von Ergebnissen

Beitragvon bocholt_1983 » Do 19. Jul 2012, 16:32

Hi Bernhard,

das ist ja schonmal SUPER - danke! Habe das Programm heruntergeladen und das funktioniert auch mit dem Beispiel Salat A wie von Dir beschrieben. Wenngleich mir immernoch nicht ganz klar ist, warum ein f-test nicht ausreicht?! Habe eine Definition gefunden die da lautet "Der t-Test ist ein Hypothesentest, mit dem Annahmen über den Erwartungswert einer oder mehrerer Grundgesamtheiten mit unbekannter Standardabweichung überprüft werden können. Insbesondere kommt der t-Test im Rahmen der Regressionsanalyse zum Einsatz: Während der F-Test Auskunft darüber gibt, ob ein ermittelter Zusammenhang als Ganzes über die Stichprobe hinaus auch für die Grundgesamtheit Gültigkeit besitzt (will ich nicht gerade das wissen?), wird mit Hilfe des t-Tests jede unabhängige Variable einzeln auf ihre Signifikanz überprüft. Wird bei einer Regressionsanalyse lediglich der Zusammenhang zwischen zwei Variablen untersucht, reicht es aus, einen der beiden Tests durchzuführen."

Ganz allgemein: Ist ein t-test da, um die Unterschiede der Mittelwerte zu untersuchen und ein f-test, um die Unterschiede der Varianzen zu überprüfen?

Bei einem t-test wäre die Nullhypothese, dass die Mittelwerte sich nicht signifikant unterscheiden. Die Unterschiede sind dann zufällig. Wenn ich es richtig sehe, dann will ich "Nullhypothese" durch die statistische Analyse ja eigentlich widerlegen, so dass der gemessene Unterschied von X% ein signifikanter Unterschied ist und das optimierte Licht eindeutig besser ist als das Referenzlicht. Wann wiederlege ich die Nullhypothese? Beim f-test muss ja die Prüfgröße größer als der F-wert sein - wie ist es beim t-test?

Was genau sagt mir im Beispiel der t-Wert von -1.5446 - muss ich jetzt noch mithilfe von Freiheitsgraden und Signifikanzniveau einen Wert aus der Tabelle ablesen und mit dem t-Wert vergleichen? Welchen Unterschied meinst Du mit "Daran kannst Du ablesen, dass der Unterschied zwischen beiden Gruppen zu 95% zwischen -4,84 und 0,63 liegt"? Ist es nicht so, dass der Unterschied zw. opt. und ref. Licht bei Salat A 9.81% beträgt und das zugehörige Konfidenzintervall sich dann von -4,84% bis 0,63% erstreckt? Macht ja irgendwie keinen Sinn - der Wert müsste doch in dem Intervall liegen oder nicht? Oder kann man sagen mit 95%-WS liegt der Unterschied zw. -4.84 und 0.63% - die 9.81 sind außerhalb des Intervalls also eher zufällig? (-4.84 zum Nachteil für welches Licht?)

Was sagt mir der "mean of differences"? Heißt der p-Wert = 0,1291, dass ich in 12,91% der Fälle die Nullhypothese fälschlicherweise ablehne? Heißt ein p-Wert > 0.05 nicht "statistisch nicht signifikant". Auch wenn dies aber nicht bedeutet, dass in Wahrheit kein Unterschied zwischen Gruppen besteht, er konnte statistisch einfach nicht nachgewiesen werden - die Wahrscheinlichkeit ist grösser als 5% (>0.05), dass der Unterschied von 9.81% durch Zufall zustande kam. Wozu brauch ich den t-wert überhaupt noch, wenn der p-Wert mir meine gewünschte Aussage liefert?

Bzgl. des Teils, der Dir unklar war:
Ich meine, dass ich ja verschiedene Salatsorten habe. Nicht nur Salat A mit seinen einzelnen Tagesabsätzen sondern auch Salat B, C bis L. Die gesamte Kategorie performt ja dann anders als ein einzelnes Produkt. Z.B kommt ja für Salat insgesamt heraus, dass das opt. Licht zu 9.27% mehr Absatz führt. Getragen wird das vor allem durch Salat A, weil er so einen großen Einfluss hat. Das war ja im Grunde meine Eingangsfrage. Für ein einzelnes Produkt steige ich noch einigermaßen dahinter, breche die Analyse quasi herunter. Was ich aber nicht weiß ist, wie ich den Prozentwert der Gesamtkategorie auf Signifikanz überprüfe. Kann ich nicht ALLE Tagesabsätze für alle Salatsorten für Referenzlicht in R eingeben und genauso ALLE für optimiertes Licht und dann den t-Test durchführen? Was dagegen spricht ist, dass nicht alle das gleiche n haben.
bocholt_1983
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Mi 18. Jul 2012, 09:18
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Signifikanz von Ergebnissen

Beitragvon bele » Do 19. Jul 2012, 20:28

bocholt_1983 hat geschrieben:das ist ja schonmal SUPER - danke! Habe das Programm heruntergeladen und das funktioniert auch mit dem Beispiel Salat A wie von Dir beschrieben.

Du kannst das Programm auch für Deine F-Teste nutzen: Die Funktion df() gibt Dir die Dichtefunktion, pf() die Verteilungsfunktion und qf() Quantile der F-Verteilung. Mehr dazu durch Eingabe von help(df) in R aber wahrscheinlich brauchst Du Google um Dich da 'rein zu fuchsen.


Wird bei einer Regressionsanalyse lediglich der Zusammenhang zwischen zwei Variablen untersucht, reicht es aus, einen der beiden Tests durchzuführen.

Bis jetzt ging es um zwei Variablen und ich habe Dir gezeigt, wie man einen von beiden ganz einfach durchführt.

Ganz allgemein: Ist ein t-test da, um die Unterschiede der Mittelwerte zu untersuchen und ein f-test, um die Unterschiede der Varianzen zu überprüfen?

Dich interessiert ja, ob mehr oder weniger Salate verkauft werden, also ob die Mittelwerte der Verkaufszahlen unterschiedlich sind. Es gibt ein Verfahren, bei dem die Analyse der Varianzen genutzt wird, um Aussagen über Mittelwertunterschiede zu treffen. Es heißt "Varianzanalyse" oder "ANOVA" und hier wird der F-Test verwendet. Die ANOVA brauchst Du, wenn Du das Licht und die verschiedenen Salatsorten und die Monate zusammen fassen willst in eine große Gesamtanalyse. Das wäre wohl der beste (parametrische) Weg. Ich wollte mit dem einfachsten Test die Komplexität überschaubar halten. Wenn Du das "richtig" auswerten willst, wird es wohl in Richtung ANOVA gehen. Amazon hat sehr viele Bücher zum Thema. ( http://de.wikipedia.org/wiki/ANOVA )

Beim f-test muss ja die Prüfgröße größer als der F-wert sein - wie ist es beim t-test? [...]muss ich jetzt noch mithilfe von Freiheitsgraden und Signifikanzniveau einen Wert aus der Tabelle ablesen und mit dem t-Wert vergleichen?

Steht alles in der Wikipedia ( http://de.wikipedia.org/wiki/Zweistichproben-t-Test , http://de.wikipedia.org/wiki/Einstichproben-t-Test ). Was ich Dir zeigen wollte war ja, dass Du gar keine kritischen Werte vergleichen musst, weil R das für Dich tut und Dir einen p-Wert und ein Konfidenzintervall für den Mittelwertunterschied ausgibt.

Ist es nicht so, dass der Unterschied zw. opt. und ref. Licht bei Salat A 9.81% beträgt und das zugehörige Konfidenzintervall sich dann von -4,84% bis 0,63% erstreckt? Macht ja irgendwie keinen Sinn

Der absolute Unterschied zwischen den Werten in der einen und denen in der anderen Gruppe beträgt zwischen -4,8 und 0,6, nicht der prozentuale.

Heißt ein p-Wert > 0.05 nicht "statistisch nicht signifikant". Auch wenn dies aber nicht bedeutet, dass in Wahrheit kein Unterschied zwischen Gruppen besteht, er konnte statistisch einfach nicht nachgewiesen werden - die Wahrscheinlichkeit ist grösser als 5% (>0.05), dass der Unterschied von 9.81% durch Zufall zustande kam. Wozu brauch ich den t-wert überhaupt noch, wenn der p-Wert mir meine gewünschte Aussage liefert?

Gar nicht - der t-Wert ist ein Zwischenergebnis ebenso wie der F-Wert (F- und t-Wert hängen sehr eng miteinander zusammen: F = t^2, siehe http://web.neuestatistik.de/inhalte_web ... 36742.html ). Die für Dich relevante Aussage steckt im p-Wert, nicht im t- oder F-Wert.

Gruß,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5780
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1357 mal in 1344 Posts

Re: Signifikanz von Ergebnissen

Beitragvon bele » Do 19. Jul 2012, 20:32

PonderStibbons hat heute in test-f8/value-levene-t1654.html geschrieben:

F-Test und t-Test liefern bei 2 Gruppen exakt dasselbe Ergebnis.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5780
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1357 mal in 1344 Posts

Re: Signifikanz von Ergebnissen

Beitragvon bocholt_1983 » Fr 20. Jul 2012, 13:25

Hi Bernhard,

Varianzanalyse bzw. ANOVA kenn ich. Hab allerdings nicht die nötige Software und außerdem müsste ich mich da tatsächlich erstmal reinkämpfen.

Habe den f-test auch mal mit R gemacht

> RefSalatA <- c(14, 14, 23, 11, 16, 20, 10, 10, 29, 29, 34, 51, 7,
+ 12, 18, 18, 14, 23, 18, 11, 36, 10, 10, 12, 15, 14,
+ 20, 10, 15, 20, 19, 20, 18, 0, 12, 34, 18, 18, 29,
+ 20, 24, 33, 16, 20, 33, 12, 20, 36)
> OptSalatA <- c(16, 15, 28, 15, 13, 22, 8, 19, 20, 23, 18, 34, 10,
+ 15, 25, 17, 13, 29, 20, 19, 21, 20, 18, 40, 12, 16,
+ 11, 0, 16, 19, 18, 14, 21, 20, 18, 36, 40, 24, 22, 24,
+ 13, 39, 20, 42, 30, 28, 27, 39)
> var.test(RefSalatA, OptSalatA, paired=TRUE)

F test to compare two variances

data: RefSalatA and OptSalatA
F = 1.0695, num df = 47, denom df = 47, p-value = 0.8189
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.5995315 1.9077778
sample estimates:
ratio of variances
1.069473

Wieso ist der p-Wert jetzt so dermaßen hoch?

VG & ein schönes WE
bocholt_1983
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Mi 18. Jul 2012, 09:18
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Mittelwert, Standardabweichung & Co.

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 2 Gäste

cron