Seite 1 von 1

Lognormal Verteilung

BeitragVerfasst: Mi 17. Mai 2017, 19:06
von Oksche
Hallo zusammen,

zu folgendem Sachverhalt habe ich Verständnisschwierigkeiten:
Ich habe eine Liste mit ausschließlich positiven Werten, die nicht normalverteilt sind (Wertebandbreite im Intervall ]0;8]). Um eine Annäherung an die Normalverteilung zu erreichen, transformiere ich diese Liste mithilfe des Logarithmus (ln). Das bedeutet, dass alle Werte im Teilintervall ]0;1[ einen negativen Wert nach der Logarithmierung annehmen. Ich möchte die Transformation nutzen, um dann mithilfe der Normalverteilung Schlussfolgerungen zu ziehen.

Was ist aber nun der Erwartungswert für den logarithmierten Datensatz? Soweit ich weiß, ist die lognormal Verteilung nach unten hin durch 0 (Null) begrenzt. Da ich aber aufgrund der oben beschriebenen Problematik auch negative Werte habe (Wertebandbreite ]-9;3[), trifft das offensichtlich nicht zu. Was bedeutet das nun für meinen Erwartungswert: Nutze ich den Mittelwert über alle logarithmierten Werte oder den Erwartungswert für die lognormal Verteilung? Welches Vorgehen ist hier angebracht?

Ich hoffe, das Problem ist verständlich beschrieben und mir kann hier jemand kurz und knapp weiterhelfen. Vielen Dank vorab :)

Re: Lognormal Verteilung

BeitragVerfasst: Mi 17. Mai 2017, 20:27
von PonderStibbons
Ich habe eine Liste mit ausschließlich positiven Werten, die nicht normalverteilt sind (Wertebandbreite im Intervall ]0;8]).

Was sind das für Werte und wie groß ist die Stichprobe?
Um eine Annäherung an die Normalverteilung zu erreichen,

Warum willst Du das, wozu soll das dienen?

Mit freundlichen Grüßen

PonderStibbons

Re: Lognormal Verteilung

BeitragVerfasst: Do 18. Mai 2017, 09:46
von Oksche
Hallo PonderStibbons,

die Werte sind normale Zahlen im oben genannten Intervall. Ihre Anzahl beläuft sich auf ca. 300.

Ich habe ein Modell erstellt, um Punkte zu vergeben. Je nach Positionierung der einzelnen Werte unterhalb der Dichtefunktion werden Punkte vergeben. Diese reichen von 0 Punkten für >-3SD bis hin zu 33 Punkten bei >3SD. Für diesen Zweck benötige ich normalverteilte Daten. Daher die Logarithmierung, die ihren Zweck erfüllt.

Auf Basis des Erwartungswertes (momentan der Mittelwert der ln-Daten) sowie der Standardabweichung (ebenfalls auf Basis der ln-Daten) errechne ich den Abstand in Standardabweichungen jedes Wertes zum Erwartungswert. Basierend auf diesem Ergebnis erfolgt die Punktevergabe. Was für mich nun icht klar ist: Berechne ich den Erwartungswert und die Standardabweichung korrekt, wenn ich nicht die Berechnung für die lognormal Verteilung verwende? Denn hierauf basiert schließlich meine Punktevergabe.

Re: Lognormal Verteilung

BeitragVerfasst: Do 18. Mai 2017, 12:37
von strukturmarionette
Hi,

die Werte sind normale Zahlen im oben genannten Intervall. Ihre Anzahl beläuft sich auf ca. 300.

- Wofür stehen die 'normalen' Zahlen?

Ich habe ein Modell erstellt, um Punkte zu vergeben.

- Was sollen die 'Punkte' repräsentieren?

Gruß
S.

Re: Lognormal Verteilung

BeitragVerfasst: Do 18. Mai 2017, 15:12
von Oksche
Servus,
die normalen Zahlen repräsentieren die Differenz aus einem Anteilsbesitz (in %) in die Aktie X vs. den durchschnittlichen Anteilsbesitz (in %) in die Aktien A bis E. Diese Differenz wird für alle Investoren der Aktien A bis E und X berechnet.

Mithilfe der Punktzahl sollen die Investoren in eine Reihenfolge gebracht werden.

VG

Re: Lognormal Verteilung

BeitragVerfasst: Do 18. Mai 2017, 15:59
von bele
Hallo Oksche,

ich habe noch nicht verstanden, warum Du von einer Lognormalverteilung ausgehst, aber das kannst Du mit Dir selbst ausmachen. Nehmen wir an, Deine ausschließlich positiven Werte von >0 bis 8 seien lognomalverteilt. Dann ist ihr Logarithmus normalverteilt. Deine Werte von -9 bis 3 wären also normalverteilt. Bei normalverteilten Daten ist es kein Problem, wenn sie negativ werden.


LG,
Bernhard

Re: Lognormal Verteilung

BeitragVerfasst: Do 18. Mai 2017, 17:34
von PonderStibbons
Je nach Positionierung der einzelnen Werte unterhalb der Dichtefunktion werden Punkte vergeben. Diese reichen von 0 Punkten für >-3SD bis hin zu 33 Punkten bei >3SD. Für diesen Zweck benötige ich normalverteilte Daten.

Warum? 3Sd sind 3Sd, unabhängig von der Verteilungsform.