Mittelwert und Standardabweichung

Univariate Statistik.

Mittelwert und Standardabweichung

Beitragvon ChristinMPunkt » Mo 4. Dez 2017, 19:33

Hallo zusammen,

ich lese gerade eine englischsprachige Studie (diese erläutere ich nicht näher, da deren Inhalt für das Verständnis und meine Frage nicht relevant ist). Leider sind bei dieser Studie die erhobenen Daten nicht angehängt worden, sodass man Berechnungen nicht eigenständig nachvollziehen kann. Ebenso geht diese Studie leider auch nicht im Text näher auf die deskriptive Statistik ein, sondern erst auf die Inferenzstatistik, dennoch werden in einem Table sämtliche Daten rund Mean, Std Error Mean und SD kommentarlos ausgeworfen (vermutlich eine Ergebniskopie aus einem Statistikprogramm). Ich wollte nun gerne abschätzen, ob die Angabe zweier Mittelwerte der Stichprobe unter Berücksichtigung der SD (es geht um eine Messwiederholung bei denselben Probanden) für die Grundgesamtheit repräsentativ ist.

Die Werte sind wie folgt:

time 1: Mean: 4.92, SD: 1.22
time 2: Mean: 4.79, SD: 1.22

Zunächst einmal kam mir die Streuung sehr groß vor, da bei Befragung der Probanden eine Rating- bzw. Likert-Skala benutzt wurde mit den Antwortmöglichkeiten 1-7.

Da ich aber nicht weiß, ob ich damit richtig liege, die SD im Verhältnis zur verwendeten Skala bzw. Maßeinheit so zu bewerten (Frage 1: oder kann ich das so tun?), fiel mir ein, dass ja zumindest bei normalverteilten Daten die Faustregel gilt, dass 68% der Daten im Bereich -1 SD bis + 1 SD liegen und 95% aller Werte im Bereich -2 SD bis + 2 SD. Das würde hier dann ja bedeuten, dass z.B. für Messung 1 gilt, 4.92 -/+ 1.22 = 68% der Daten liegen im Bereich 3.7 bis 6.14, sodass man argumentieren könnte, dass die Streuung doch insgesamt viel zu groß ist
Frage 2: Ist eine solche Schlussfolgerung an sich richtig? Oder wie gelingt es mir alternativ, die Größe einer Streuung gemessen an der verwendeten Skala und dem angegebenen Mittelwert zu bewerten?
Frage 3: Dabei ist mir aufgefallen, dass bei diesen Daten 2 SD schon außerhalb der möglichen maximalen Antwort liegen, da es ja nur eine 7-stufige Likertskala ist: 4.92 + ( 2 x 1.22) = 7.36. Kann ich daher für diese Daten daraus schließen, dass es sich nicht um normalverteilte Daten handelt (z.B. weil Ausreißer die Verteilung schief werden lassen), weil ja die Faustregel (68% der Daten befinden sich im Bereich -1 bis + 1 SD und 95% der Daten im Bereich -2 SD bis + 2 SD) eine Normalverteilung voraussetzt? Da in der Studie wie gesagt keinerlei Daten zur Berechnung beigefügt sind, könnte ich so zumindest etwas über die Verteilung aussagen.

Ist ein bisschen langatmig erklärt, hoffe, ich konnte meine Fragen verständlich rüber bringen.
ChristinMPunkt
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Mi 22. Nov 2017, 11:45
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Mittelwert und Standardabweichung

Beitragvon PonderStibbons » Mo 4. Dez 2017, 20:02

Zunächst einmal kam mir die Streuung sehr groß vor, da bei Befragung der Probanden eine Rating- bzw. Likert-Skala benutzt wurde mit den Antwortmöglichkeiten 1-7.

Likert-Item womöglich, nicht Likert-Skala.

Die Standardabweichung sieht nicht auffallend groß aus.

dass z.B. für Messung 1 gilt, 4.92 -/+ 1.22 = 68% der Daten liegen im Bereich 3.7 bis 6.14, sodass man argumentieren könnte, dass die Streuung doch insgesamt viel zu groß ist

Es könnte sein, dass ca. 2/3 der Probanden die Skalenwerte 3-6 oder 4-6 verwendet haben. Was wäre daran ungewöhnlich?
Kann ich daher für diese Daten daraus schließen, dass es sich nicht um normalverteilte Daten handelt

Eine 7erskala kann überhaupt nicht normalverteilt sein, das geht aufgrund des Skalenniveaus und der Stufung nicht. Wenn man das mal ignoriert, liegt in der Tat die Annahme eine rechtsschiefen Verteilung nahe.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11258
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2473 mal in 2457 Posts

Re: Mittelwert und Standardabweichung

Beitragvon ChristinMPunkt » Mo 4. Dez 2017, 22:19

Danke für die Antwort, hier nochmal einige Rückfragen.

Meine zentrale Frage war, woran man erkennen kann, dass eine SD nun entweder groß oder klein ist.... Indem man wie hier die 1.22 an der Skala 1-7 bemisst? Wenn die SD von 1.22 klein ist, gibt es denn eine Art allgemeine Konvention, ab wann man in diesem Fall von einer großen SD sprechen würde? Ich habe dafür einfach noch kein Gefühl entwickelt...
ChristinMPunkt
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Mi 22. Nov 2017, 11:45
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Mittelwert und Standardabweichung

Beitragvon ChristinMPunkt » Mo 4. Dez 2017, 22:31

Zu früh abgeschickt, hatte noch eine Frage:

Habe ich denn richtig schlussgefolgert, dass wenn 2 SD vom Mittelwert entfernt schon größer sind als das Maximum von 7,es sich dann gar nicht um eine Normalverteilung handeln kann??? (unabhängig von anderen Kriterien, nur auf diesen Gedanken bezogen, denn Rating-Skalen, auch wenn streng genommen ordinalskaliert, werden in der empirischen Psychologie als Intervallskala behandelt und könnten demnach auch normalverteil sein). Falls Frage missverständlich ausgedrückt ist, nochmal anders gefragt: wenn Daten normalverteilt sind, dann sollte man doch dem Mittelwert stets 3 SD hinzufügen können und würde noch nicht die höchste Antwortausprägung erreichen, oder?

Sorry, bin Statistik-Neuling, daher vielleicht manchmal etwas ungewohnt ausgedrückt, aber sehr wichtig für mich, vielen Dank im Voraus
ChristinMPunkt
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Mi 22. Nov 2017, 11:45
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Mittelwert und Standardabweichung

Beitragvon PonderStibbons » Mo 4. Dez 2017, 23:40

Meine zentrale Frage war, woran man erkennen kann, dass eine SD nun entweder groß oder klein ist...

Durch Bezug auf einen gewählten Maßstab, zum Beispiel das Antwortverhalten anderer Stichproben oder eine eigene Einschätzung anhand sachlogischer Überlegungen. Es gibt keine generellen Regeln. Wozu überhaupt die Frage?
Habe ich denn richtig schlussgefolgert, dass wenn 2 SD vom Mittelwert entfernt schon größer sind als das Maximum von 7,es sich dann gar nicht um eine Normalverteilung handeln kann?

Ja.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11258
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2473 mal in 2457 Posts

Re: Mittelwert und Standardabweichung

Beitragvon ChristinMPunkt » Di 5. Dez 2017, 11:10

Vielen Dank, das hat sehr geholfen.

Ich muss mündlich eine Studie vortragen, dazu gehört anfangs auch kurz die deskripitive Statistik, die nicht näher erläutert wird. Wenn ich Mean und SD an die Wand werfe, muss ich immerhin was dazu sagen können, z.B. ob der Mittelwert überhaupt repräsentativ für die Stichprobe ist, da er ja auch verzerrt sein kann, weil je größer die SD, desto weniger Aussagekraft hat der Mittelwert, oder?

Da ich den Median nicht gegeben habe und nicht berechnen kann, kann ich leider nicht überprüfen, ob die Verteilung rechts- oder linksschief ist. Aber wie kann man die Annahme einer schiefen Verteilung hier begründen bzw. welche Indizien kann man vorbringen?
ChristinMPunkt
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Mi 22. Nov 2017, 11:45
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Mittelwert und Standardabweichung

Beitragvon PonderStibbons » Di 5. Dez 2017, 12:12

ob der Mittelwert überhaupt repräsentativ für die Stichprobe ist, da er ja auch verzerrt sein kann, weil je größer die SD, desto weniger Aussagekraft hat der Mittelwert, oder?

Das ist ein exklusiver Gedankengang, der ist mir leider nicht geläufig.
Da ich den Median nicht gegeben habe und nicht berechnen kann, kann ich leider nicht überprüfen, ob die Verteilung rechts- oder linksschief ist.

So wichtig erscheint das hier auch nicht, wenn man nur mal kurz die Kennwerte referieren will. Aber da 2SD über die obere Skalengrenze ginge, muss das Ganze rechtsschief sein.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11258
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2473 mal in 2457 Posts

Re: Mittelwert und Standardabweichung

Beitragvon bele » Di 5. Dez 2017, 12:31

Hallo Christin,

es scheint so, als drehtest Du Dich in einem Kreis. Eine Sieben-Punkt-Skala kann nicht einer Normalverteilung folgen, beispielsweise weil sie eine Ober- und eine Untergrenze hat, was eine Normalverteilung nicht hat. Vielleicht kannst Du unter irgendwelchen komischen Annahmen manchmal zwei Augen zudrücken und so tun, also folgte sie doch einer Normalverteilung, aber dann darfst Du nachher nicht überrascht sein, wenn die Regeln einer Normalverteilung eben nicht gelten. Wasch mich, aber mach mich nicht nass. Entweder alle Augen zudrücken oder alle Regeln anwenden.

wenn Daten normalverteilt sind, dann sollte man doch dem Mittelwert stets 3 SD hinzufügen können

Ja, und wenn wir pi = 2 setzen, dann ist pi geradzahlig. Aber pi = 2 setzen hilft nichts, wenn man Kreisumfänge berechnen will.

Wie Du so etwas kompliziertes wie Repräsentativität der Stichprobe durch ein Kriterium der Standardabweichung begründen willst, verstehe ich nicht. Hier muss irgendwo das eigentliche Missverständnis liegen. Eine siebenstufige Antwort bleibt auch in der Grundgesamtheit siebenstufig und wenn die Stichprobe repräsentativ für die Grundgesamtheit ist, dann steht ihre siebenstufige Antwort für die siebenstufigen Antwort, die die Grundgesamtheit gegeben hätte. Auch in der Grundgesamtheit ist die Antwort siebenstufig und nicht normalverteilt. Regeln, die für Normalverteilungen gelten (z. B: 99% in einem Spektrum von -3sigma bis +3sigma) gelten für siebenstufige Antworten nicht. Weder in der Stichprobe, noch in der Grundgesamtheit.

Repräsentativität kannst Du daher damit nicht erfassen. Wenn Du findest, dass die Siebenstufigkeit die zugrundeliegende Größe unzureichend abbildet, weil beispielsweise nicht genug Raum ist, die extremen Ränder von der Mitte zu unterscheiden, dann mag das eine berechtigte Kritik an der Studie sein. Es ist aber nicht per se ein Problem der Repräsentativität der Stichprobe.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5774
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1356 mal in 1343 Posts

Re: Mittelwert und Standardabweichung

Beitragvon ChristinMPunkt » Di 5. Dez 2017, 13:57

Repräsentativität war so gemeint, dass wenn z.B. an einem Tag die Temperaturen stark schwanken, der Mittelwert nicht so repräsentativ für die Werte ist, da man durch ihn trotzdem nicht weiß, wie man sich durchschnittlich anzuziehen hat. Wenn die Temperatur aber weniger schwankt, ist ein Mittelwert für mich aussagekräftiger. Es ging mir hier nur um die deskriptive Statistik, nicht die Inferenzstatistik, bei der man auf die Grundgesamtheit schließt. Das hatte ich aber auch so formuliert.

Jetzt bin ich leider sehr verwirrt. Wieso kann denn eine Likert-Skala nicht normalverteilt sein? Wenn ich es richtig verstanden habe, weil sie endlich ist? Irgendwo ist doch auch die Grundgesamtheit in ihren Messwerten endlich, und wenn ich in Statistik richtig aufgepasst habe, so unterliegen bei Erhöhung der Stichprobe fast alle Messungen einer Normalverteilung... wenn meine Likert-Skala nicht durch systematische Fehler wie Deckeneffekte oder zentrale Tendenz oder soziale Erwünschtheit verzerrt wird, was spricht dann gegen eine Normalverteilung?
ChristinMPunkt
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Mi 22. Nov 2017, 11:45
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Mittelwert und Standardabweichung

Beitragvon PonderStibbons » Di 5. Dez 2017, 15:45

wenn ich in Statistik richtig aufgepasst habe, so unterliegen bei Erhöhung der Stichprobe fast alle Messungen einer Normalverteilung...

Im Gegenteil, je größer die Stichprobe, desto zuverlässiger lässt sich nachweisen, dass keine (exakte) Normalverteilung vorliegt. Und wieso sollte auch eine große Stichprobe, die aus z.B. einer Gleichverteilung in der Grundgesamtheit gezogen wurde, wundersamerweise normalverteilte Messwerte aufweisen?

Was in deiner Vorlesung vermutlich dargestellt wurde, war der zentrale Grenzwertsatz. Wenn aus einer (fast) beliebig verteilten Grundgesamtheit immer wieder Stichproben der Größe z.B. 50 gezogen werden, dann folgt die Verteilung der Mittelwerte dieser 50'er-Stichproben annähernd einer Normalverteilung. Bei Stichproben n=100 noch mehr, bei 1000 noch mehr etc.

Hingegen bei wiederholter Ziehung von kleineren Stichproben (n < 30) ist das nicht in der Weise der Fall, da müssen die Messwerte in der Grundgesamtheit, aus der die Stichproben stammen, einer Normalverteilung folgen, damit sich die Stichproben-Mittelwerte annähernd normalverteilen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11258
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2473 mal in 2457 Posts

Nächste

Zurück zu Mittelwert, Standardabweichung & Co.

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron