Seite 1 von 1

SD von zwei mittl. Konzentrationsänderungen + Varianz von %

BeitragVerfasst: So 25. Apr 2021, 14:05
von Gänseblümchen
Hallo zusammen,
vll. kann mir ja jemand helfen.

Ich habe folgende Excel-Tabelle erstellt: (die Datei ist leider zu groß zum anhängen)
https://www.dropbox.com/scl/fi/b9be6lqjvx3xwkqoxoycz/Ammonium_Beispiel.xlsx?dl=0&rlkey=hu6x46lhmt9kd94opv7u849el
Es wurden zum jeweiligen Zeitpunkt Zufluss- und Abflusskonzentrationen gemessen und ich muss hieraus die Konzentrationsveränderung (Retention) in % errechnen.
Aus diesen Konzentrationsveränderungen (%) erstelle ich mit Hilfe von "R" einen Boxplot. Diesen Boxplot vergleiche ich mit weiteren Boxplots. Dafür möchte ich die Varianzen der unterschiedlichen Boxplots vergleichen, um eine Aussage über ihre Streuung zu machen.

1. Frage:
Kann ich die Varianz der %-Angaben (Retentionsleistung) einfach mit den ganzzahligen Werten errechnen (in meinem Bsp. 676) oder muss ich die %-Angaben erst durch 100 teilen und die Varianz der Kommazahlen errechnen (hier 0,0676). Falls letzteres zutrifft: muss ich den errechneten Varianzwert (0,0676) dann mal 10000 (100*100) nehmen um wieder die Einheit % zu haben?
Bei der Standardabweichung müsste ich ja *100 rechnen.

2. Frage:
Ich habe die mittlere Zuflusskonz. (0,35) + Standardabweichung (0,27) und die mittlere Abflusskonz. (0,04) + Standardabweichung (0,02) errechnet.
Aus den mittleren Konzentrationen ergibt sich eine Konzentrationsänderung von 89%. (0,35-0,04)/0,35*100=89%
Wie kann ich zu den 89% die Standardabweichung berechnen?

Vielen Dank
Marla

Re: SD von zwei mittl. Konzentrationsänderungen + Varianz vo

BeitragVerfasst: So 25. Apr 2021, 15:05
von bele
Hallo Gänseblümchen,

Gänseblümchen hat geschrieben:Ich habe folgende Excel-Tabelle erstellt: (die Datei ist leider zu groß zum anhängen)


Das hat mit der Größe nichts zu tun. Wir dürfen hier einfach alle gar nichts anhängen. Wenn Du die Daten bereits in R eingelesen hast, kannst Du sie mit der Funktion dput() in eine forumstaugliche Version umwandeln, die sich dann hier in code-Tags posten lässt. Verkürzt könnte das dann so aussehen:

Code: Alles auswählen
bsp <- structure(list(Jahr = c(2001L, 2001L, 2001L, 2001L, 2001L, 2002L,
2002L, 2002L, 2002L, 2002L, 2002L, 2002L, 2002L, 2002L, 2002L,
2002L, 2002L, 2003L), Monat = c("Aug", "Sept", "Okt", "Nov",
"Dez", "Jan", "Feb", "März", "April", "Mai", "Juni", "Juli",
"Aug", "Sep", "Okt", "Nov", "Dez", "Jan"), NH4..In..mg.l.1. = c(0.81,
0.82, 0.49, 0.59, 0.96, 0.69, 0.33, 0.38, 0.04, 0.06, 0.24, 0.51,
0.61, 0.49, 0.57, 0.24, 0.06, 0.12), NH4..Out..mg.l.1. = c(0.07,
0.03, 0.03, 0.01, 0.02, 0.06, 0.05, 0.02, 0.03, 0.02, 0.07, 0.04,
0.03, 0.03, 0.02, 0.04, 0.04, 0.02), Retention... = c(91L, 96L,
94L, 98L, 98L, 91L, 85L, 95L, 25L, 67L, 71L, 92L, 95L, 94L, 96L,
83L, 33L, 83L), Retention = c("0,91", "0,96", "0,94", "0,98",
"0,98", "0,91", "0,85", "0,95", "0,25", "0,67", "0,71", "0,92",
"0,95", "0,94", "0,96", "0,83", "0,33", "0,83\"")), class = "data.frame", row.names = c(NA,
-18L))
head(bsp)
boxplot(bsp[,3], bsp[,4])

Das kann dann jeder einfach in eine offene R Konsole copypasten und sieht, was Sache ist bzw. kan ausprobieren, was eine gute Antwort wäre. Die Variante mit dem dropbox-Link ist natürlich besser für alle die, die kein R nutzen.

Aus diesen Konzentrationsveränderungen (%) erstelle ich mit Hilfe von "R" einen Boxplot. Diesen Boxplot vergleiche ich mit weiteren Boxplots. Dafür möchte ich die Varianzen der unterschiedlichen Boxplots vergleichen, um eine Aussage über ihre Streuung zu machen.


Das klingt bestimmt kleinlich, aber Boxplots haben keine Varianzen. Die Wertereihen, aus denen Du den Boxplot errechnet hast, die haben Varianzen.

Falls letzteres zutrifft: muss ich den errechneten Varianzwert (0,0676) dann mal 10000 (100*100) nehmen um wieder die Einheit % zu haben?
Bei der Standardabweichung müsste ich ja *100 rechnen.


Egal, womit Du die Varianz multiplizierst. Sie wird niemals die gleiche Einheit haben wie die Werte, aus denen sie errechnet wurde. Das genau ist der ganz große Vorteil von Standardabweichungen gegenüber Varianzen, dass sie die gleiche Einheit haben. Mein Vorschlag wäre darum, das mit den Varianzen bleiben zu lassen und bei Standardabweichungen zu bleiben.

Ich habe die mittlere Zuflusskonz. (0,35) + Standardabweichung (0,27) und die mittlere Abflusskonz. (0,04) + Standardabweichung (0,02) errechnet.
Aus den mittleren Konzentrationen ergibt sich eine Konzentrationsänderung von 89%. (0,35-0,04)/0,35*100=89%
Wie kann ich zu den 89% die Standardabweichung berechnen?


Indem Du nicht die mittleren Zufluss- und Abflusskonzentrationen heranziehst sondern zeilenweise Konzentrationsänderung (pro Zeile) berechnest. Diese neue Spalte "Konzentrationsänderung" hat dann einen Mittelwert und eine Standardabweichung, die sich strikt nach der Formel für Standardabweichungen berechnen lässt. In R kann dazu die Funktion sd() sehr hilfreich sein, wenn Du die aus der Stichprobe geschätzte Standardabweichung berechnen möchtest.

LG,
Bernhard

Re: SD von zwei mittl. Konzentrationsänderungen + Varianz vo

BeitragVerfasst: So 25. Apr 2021, 18:03
von Gänseblümchen
Vielen Dank für die schnelle und hilfreiche Antwort, Bernhard!

Indem Du nicht die mittleren Zufluss- und Abflusskonzentrationen heranziehst sondern zeilenweise Konzentrationsänderung (pro Zeile) berechnest. Diese neue Spalte "Konzentrationsänderung" hat dann einen Mittelwert und eine Standardabweichung, die sich strikt nach der Formel für Standardabweichungen berechnen lässt. In R kann dazu die Funktion sd() sehr hilfreich sein, wenn Du die aus der Stichprobe geschätzte Standardabweichung berechnen möchtest.


Benutzte ich, um die Standardabweichung zu berechnen die Konzentrationsänderungen in % (z. B. 91%) oder rechne ich mit den Kommazahlen (z. B. 0,91)?

Viele Grüße
Marla

Re: SD von zwei mittl. Konzentrationsänderungen + Varianz vo

BeitragVerfasst: So 25. Apr 2021, 19:18
von bele
Nach meinem Verständnis ist das egal, bzw. reine Geschmackssache. Es wäre halt gut, konsistent immer das eine oder immer das andere zu verwenden.

LG,
Bernhard