Wie viele Messungen notwendig für gleiche zentrale Tendenz
Verfasst: So 15. Sep 2019, 09:48
Hey zusammen
Ich habe mal wieder eine Fragestellung und bin mir (wie immer) nicht sicher, ob ich das überhaupt statistisch untersuchen kann.
Ich erzeuge mir Zufallszahlen für 3 Variablen welche Normalverteilt sind: a, b und c.
a: μ = 1, σ = 0.05 (1 + 0.05 * randn(25,1))
B: μ = 0.04, σ = 0.0005 (0.04 + 0.0005 * randn(25,1))
c: μ = 0.6 σ = 0.05 (0.6 + 0.05 * randn(25,1))
Mit Hilfe der drei Variablen berechne ich dann die zu untersuchende Basis der Daten mittels d1=a+b+c. Das ganze 25 mal.
Dann erzeuge ich mir noch einmal Daten (N = 5, 10, 15 und 25), diese werden aber zusätzlich noch einmal verrauscht (d2 = a+b+c + rauschen).
Ich möchte jetzt feststellen, ob 5, 10, 15 oder 25 Werte gemessen werden müssen, um eine ähnlichen Mittelwert bzw. eine ähnliche Verteilung der Werte zu erhalten wie in d1.
Beispieltabelle: https://ibb.co/jD2DH9z
Boxplot: https://ibb.co/bWHKrkM
(Im Forum kann ich direkt nichts hochladen, da erhalte ich: "Das Kontingent für Dateianhänge ist bereits vollständig ausgenutzt.")
Im Boxplot sieht es für mich erst mal so aus, als ob N = 5 und 10 nicht ausreichend sind, 15 und 25 aber schon.
Wie könnte ich das jetzt statistisch korrekt beschreiben?
Untersuchung 1: Unterscheiden sich N 5, 10, 15 und 25 signifikant? -> Varianzanalyse (unbalanciert)?
Untersuchung 2: Reichen N Messung aus? Da würde ich jedes d2 (N = 5, 10, 15 und 25) mit d1 vergleichen. Alle Daten sind jedes mal zufällig generiert -> unabhängig, weil zufällige Zahlen? Oder ist es doch abhängig, weil die Zufallszahlen aus einem bestimmten Bereich (siehe μ und σ) erzeugt werden?
Hoffe ihr könnt mir weiterhelfen.
Ich habe mal wieder eine Fragestellung und bin mir (wie immer) nicht sicher, ob ich das überhaupt statistisch untersuchen kann.
Ich erzeuge mir Zufallszahlen für 3 Variablen welche Normalverteilt sind: a, b und c.
a: μ = 1, σ = 0.05 (1 + 0.05 * randn(25,1))
B: μ = 0.04, σ = 0.0005 (0.04 + 0.0005 * randn(25,1))
c: μ = 0.6 σ = 0.05 (0.6 + 0.05 * randn(25,1))
Mit Hilfe der drei Variablen berechne ich dann die zu untersuchende Basis der Daten mittels d1=a+b+c. Das ganze 25 mal.
Dann erzeuge ich mir noch einmal Daten (N = 5, 10, 15 und 25), diese werden aber zusätzlich noch einmal verrauscht (d2 = a+b+c + rauschen).
Ich möchte jetzt feststellen, ob 5, 10, 15 oder 25 Werte gemessen werden müssen, um eine ähnlichen Mittelwert bzw. eine ähnliche Verteilung der Werte zu erhalten wie in d1.
Beispieltabelle: https://ibb.co/jD2DH9z
Boxplot: https://ibb.co/bWHKrkM
(Im Forum kann ich direkt nichts hochladen, da erhalte ich: "Das Kontingent für Dateianhänge ist bereits vollständig ausgenutzt.")
Im Boxplot sieht es für mich erst mal so aus, als ob N = 5 und 10 nicht ausreichend sind, 15 und 25 aber schon.
Wie könnte ich das jetzt statistisch korrekt beschreiben?
Untersuchung 1: Unterscheiden sich N 5, 10, 15 und 25 signifikant? -> Varianzanalyse (unbalanciert)?
Untersuchung 2: Reichen N Messung aus? Da würde ich jedes d2 (N = 5, 10, 15 und 25) mit d1 vergleichen. Alle Daten sind jedes mal zufällig generiert -> unabhängig, weil zufällige Zahlen? Oder ist es doch abhängig, weil die Zufallszahlen aus einem bestimmten Bereich (siehe μ und σ) erzeugt werden?
Hoffe ihr könnt mir weiterhelfen.