Darstellung der Verteilung von nicht-normalverteilten Daten

Fragen, die sich auf kein spezielles Verfahren beziehen.

Darstellung der Verteilung von nicht-normalverteilten Daten

Beitragvon Em123 » Sa 2. Okt 2021, 14:59

Hallo miteinander

Ich habe eine ziemlich grundlegende Frage.. Ich habe einen Datensatz mit über 500 Objekten die jeweils einen bestimmten Wert haben. Die Werte sind nicht normalverteilt, die meisten Werte sind tief, einige wenige sind in der Mitte und ein paar ganz hohe Werte sind auch dabei. Diese 500 Werte in einem Histogramm darzustellen, macht wenig Sinn.

Meine Frage ist nun, ob eine histogrammartige Darstellung mit variablen Intervallen statistisch valid ist? Oder gibt es eine Alternative, wie ich die Verteilung der nicht-normalverteilten Daten grafisch darstellen könnte?

Ich würde mich sehr über eine Antwort freuen und bedanke mich im Vorraus! :D
Em123
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 2. Okt 2021, 14:35
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Darstellung der Verteilung von nicht-normalverteilten Da

Beitragvon Em123 » Sa 2. Okt 2021, 15:21

Ich habe eine Grafik vorbereitet die alles erklären sollte, kann sie aber leider nicht anhängen. Gerne versuche ich es zu beschreiben. Es handelt sich konkret um über 500 Gene, die alle einen bestimmten Expressionswert haben. Wenn ich diese Werte in einem Histogramm darstelle, sieht man eigentlich nur einen grossen Balken und viele ganz kleine Balken (weil der Grossteil der Werte tief sind).

Vielen Dank für die schnelle Antwort!
Em
Em123
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 2. Okt 2021, 14:35
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Darstellung der Verteilung von nicht-normalverteilten Da

Beitragvon bele » Sa 2. Okt 2021, 15:45

Hallo Em,

wenn dir Frage lautet, ob alle Balken im Histogramm immer gleich breit sein müssen lautet die Antwort klar: nein.
Man kann hier zwar keine Grafiken hochladen, man kann aber welche verlinken. Diese hier habe ich zum Beispiel in der Wikipedia gefunden:

Bild

Es ist also nicht undenkbar, wenn es in der Wikipedia als Beispiel genutzt wird. Der Text dazu beschreibt ziemlich gut Deine Situation:
Using wider bins where the density of the underlying data points is low reduces noise due to sampling randomness; using narrower bins where the density is high (so the signal drowns the noise) gives greater precision to the density estimation. Thus varying the bin-width within a histogram can be beneficial. Nonetheless, equal-width bins are widely used.

Nachlesbar unter https://en.wikipedia.org/wiki/Histogram

Beantwortet das die Frage?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5764
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1351 mal in 1338 Posts

folgende User möchten sich bei bele bedanken:
Em123

Re: Darstellung der Verteilung von nicht-normalverteilten Da

Beitragvon Em123 » So 3. Okt 2021, 15:26

Leider eignet sich diese Darstellung auch nicht für meine Daten, da die meisten Werte tief sind (zwischen 0-500) und einige wenige hohe Werte über 20000 dabei sind :(
LG
Em
Em123
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 2. Okt 2021, 14:35
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Darstellung der Verteilung von nicht-normalverteilten Da

Beitragvon bele » So 3. Okt 2021, 16:59

Ich kann mich nicht erinnern, je ein Histogramm mit logarithmischer Häufigkeitsachse gesehen zu haben und weiß auch nicht, wie gut das lesbar wäre, käme aber als Versuch im speziellen Fall infrage.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5764
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1351 mal in 1338 Posts

Re: Darstellung der Verteilung von nicht-normalverteilten Da

Beitragvon PonderStibbons » So 3. Okt 2021, 22:47

PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11250
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2469 mal in 2453 Posts

Re: Darstellung der Verteilung von nicht-normalverteilten Da

Beitragvon bele » Di 5. Okt 2021, 07:52

Hmmm, bevor EM den Beitrag in "eignet sich nicht" geändert hat stand da
Hallo Bernhard, vielen Dank für deine ausführliche Antwort! Ich habe eigentlich gemeint, dass ich manuell Balken gemacht hätte wie z.B.: 0-1, 1-5, 5-10, 10-50, 50-100, usw..
Aber deine Lösung gefällt mir weitaus besser! Ich werde es einmal ausprobieren.


und ich weiß immer noch nicht, wie das gemeint war. Wenn die aufgelisteten Intervalle für die y-Achse gelten sollen, dann scheint das im Vergleich zu logarithmischem Abtragen irgendwie beliebig, aber wenn das bedeuten soll, dass man für getrennte Wertebereiche verschiedene Histogramme zeichnet, dann kann das natürlich ein Ansatz sein.

Na gut, ist jetzt eh egal. Dutchie hat im oben verlinkten Thread einen Boxplot vorgeschlagen und wenn das als akzeptable Antwort gilt dann bitteschön.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5764
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1351 mal in 1338 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste