non-param. Streuungs = Dispersions = Concentrations-Maße

non-param. Streuungs = Dispersions = Concentrations-Maße

Beitragvon researcher » So 30. Sep 2012, 18:34

Hallo liebes Forum,

ich suche nach geeigneten deskriptiven statistischen Maßen, die mir die Streuung = Dispersion = Concentration einer Verteilung beschreiben für den Fall, dass diese eben NICHT normalverteilt=gaussian ist, was ja oft vorkommt. Normalerweise gibt es ja die Standardabweichung (SD), aber die macht eigentlich nur Sinn, wenn es sich um eine Normalverteilung handelt.

Da gibt es zum Beispiel folgenden Online-Calculator: http://www.wessa.net/co.wasp , der die Maße entropy, maximum entropy, normalized entropy, exponential index, Lorenz curve, Herfindahl index, Gini coefficient, and concentration coefficient ausrechnet.

Das hat alles was mit Entropie usw. zu tun und klar, jeder Coeff hat Vorteile und Nachteile und beschreibt das Phänomen "Streuung" auf andere Weise/Aspekt. Ich wollte doch "nur" ein Maß für die Stärke der Fluktuation meiner Meßwerte haben, die nicht normalverteilt sind, um diese von Fall zu Fall vergleichen zu können... Ich möchte "nur" wissen, ob sich die Fälle nicht nur in ihrer zentraken Tendenz, sondern auch in ihrer Streuung unterscheiden...die Standardabweichung (SD) versagt dabei leider völlig, in den anderen Maßen ...HILFE!! Welchen Coeff soll ich denn nehmen? Ich versuche es gerade mit GINI, aber ich bin mir unsicher...

Hat jemand irgendwelche Ideen ? Jeden sachdienlichen Hinweis melden sie bitte der nächsten Ploizeistation oder schreiben Sie ihn in dieses Forum!

Grüsse
researcher
Beobachter
Beobachter
 
Beiträge: 13
Registriert: So 30. Sep 2012, 17:35
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: non-param. Streuungs = Dispersions = Concentrations-Maße

Beitragvon researcher » So 30. Sep 2012, 18:53

Hier die Meß-Daten (Magnituden der baseline-korregierten Spectral Power Densities PSDs des EEGs bei verschiedenen Flickerlichtfrequenzen) über N=18 Fälle; Zeilen=Flickerfrequenzen, Spalten=Fälle/subjects; seperator=semicolon

26,410;16,590;9,750;20,200;15,040;4,925;38,660;15,040;6,916;8,278;38,510;7,933;1,752;18,290;10,020;37,090;25,580;58,850
10,730;8,590;11,460;10,860;8,730;16,410;42,590;8,873;2,027;20,810;39,620;7,072;3,664;33,300;30,120;52,180;22,070;53,010
27,640;6,224;7,715;15,770;7,849;12,790;39,950;7,849;3,729;47,280;18,560;11,860;2,466;39,150;34,250;24,990;38,320;64,670
7,934;8,715;17,440;19,140;2,421;2,525;14,900;2,421;2,064;10,900;1,282;6,574;6,216;10,730;3,592;28,120;7,301;31,710
23,860;18,610;7,473;19,920;10,570;2,273;20,670;10,570;4,018;53,460;27,130;9,052;8,812;74,710;24,240;40,850;22,930;43,040
12,870;11,370;8,842;14,430;6,993;4,589;18,930;6,993;3,386;104,600;31,740;13,280;6,544;57,920;16,680;25,570;20,220;13,730
28,250;18,750;14,140;26,450;6,516;8,136;18,510;6,516;3,117;59,040;38,870;6,623;5,364;68,390;11,300;24,040;27,300;21,630
12,420;10,680;4,941;26,680;2,783;4,439;16,090;2,783;6,262;74,280;45,120;2,962;12,620;83,530;15,840;8,860;25,870;20,790
7,235;29,440;14,780;75,870;4,295;14,230;35,060;4,295;7,730;74,030;52,350;3,541;5,731;66,660;9,155;21,550;22,590;47,820
21,850;14,200;10,090;19,990;3,511;13,820;23,890;3,511;4,415;39,130;57,310;4,778;11,450;80,500;10,450;9,282;13,090;12,580
19,770;13,750;29,460;61,780;8,964;11,750;39,740;8,964;8,258;78,780;84,900;5,373;22,500;68,950;13,810;13,720;7,014;25,440
6,757;11,240;11,050;12,430;11,980;12,940;9,705;11,980;9,385;71,540;29,950;5,154;18,660;31,490;14,810;5,778;5,485;9,173
8,403;15,660;25,100;64,690;12,090;4,293;36,340;12,090;13,640;60,870;56,990;7,461;10,290;44,910;9,546;6,118;3,973;16,470
8,404;16,060;20,390;30,140;5,453;10,780;17,000;5,453;11,880;57,970;70,270;4,844;16,200;27,900;9,842;3,471;8,207;10,910
5,362;25,790;24,830;46,620;12,040;12,770;28,890;12,040;6,742;54,000;56,270;8,429;5,617;58,540;5,514;7,063;3,237;34,130
24,620;20,410;10,880;42,620;7,071;10,830;9,859;7,071;12,960;105,800;30,420;5,940;8,749;51,920;4,232;2,190;5,170;18,830
12,220;18,750;9,423;39,230;8,750;4,162;14,560;8,750;14,570;42,960;16,030;4,392;2,385;19,730;5,066;1,679;1,722;32,080
26,580;26,610;21,390;26,050;8,434;3,942;14,750;8,434;19,920;39,650;31,340;7,527;7,973;21,090;1,979;3,963;5,557;14,430
9,717;17,100;22,660;32,940;6,950;3,275;21,090;6,951;11,130;98,900;15,830;1,247;6,395;74,480;6,003;5,203;12,270;36,910
2,983;9,213;6,940;21,740;9,921;2,800;13,950;9,921;21,540;81,670;11,410;3,013;5,120;39,330;3,751;5,356;5,138;34,320
researcher
Beobachter
Beobachter
 
Beiträge: 13
Registriert: So 30. Sep 2012, 17:35
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: non-param. Streuungs = Dispersions = Concentrations-Maße

Beitragvon PonderStibbons » So 30. Sep 2012, 21:15

Normalerweise gibt es ja die Standardabweichung (SD), aber die macht eigentlich nur Sinn, wenn es sich um eine Normalverteilung handelt.

Das ist eine etwas überraschende Behauptung. Wieso sollte die
Standardabweichung keinen Sinn ergeben, wenn eine Verteilung
(wie fast immer) nicht normal ist?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11269
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2475 mal in 2459 Posts

Re: non-param. Streuungs = Dispersions = Concentrations-Maße

Beitragvon researcher » Mo 1. Okt 2012, 01:48

Ich hatte das irgendwo gelesen und erinnere mich gerade nicht mehr, WO...nun ja...die Standard"abweichung" setzt ja eine Referenz voraus, von der die Messwerte abweichen, nämlich von der zentralen Tendez, hier dem Mittelwert. Man kann dasselbe Prinzip bei schiefen Verteilungen anwenden, indem man statt dem Mittelwert den Median als Referenz nimmt, das ergibt dann die "median absolute deviation = MedMed = MAD".

Tja, aber was ist, wenn wir eine Verteilung haben, die weder normal noch schief ist? Bei bimodalen Verteilungen ist es sicher besser die Stichprobe in zwei Teile zu teilen, weil bimodale Verteilungen oft Ausdruck einer Vermischung/Überlagerung sind, die Fälle/Subjekte entstammen ggf. aus zwei verschiedenen Grundgesamtheiten und man sollte das dann wohl eher mit ZWEI M /Mdn und SDs beschreiben. Aber was passiert, wenn wir eine weder normale, noch schiefe, noch bi/tri/etc-modale Verteilung haben...dann ist doch wohl die beste Referenz die Gleichverteilung und wir suchen dann Maße, die die Abweichung von dieser maximalen Dispersion quantifizieren...weil...mehr gestreut als die Gleichverteilung geht nimmer...z.B. wird ja auch die Ungleichheit des Einkommens nicht mit der SD, sondern eher mit dem GINI-Coefficienten beschrieben: http://en.wikipedia.org/wiki/Gini_coefficient " Guck Dir mal bitte die Weltkarte an, ich finde dass man hier schon sieht, dass der GINI-Coeff Umstände reflektiert, die durchaus etwas mit der Realität in diesen Ländern zu tun haben, also die Weltkarte kann man als Validitätskriterium dieses Coeff ansehen.

" [...] The Gini coefficient is a full-information measure, looking at all parts of the distribution. It is probably the most well-known and broadly used measure of inequality used in economic literature. The Gini coefficient facilitates direct comparison of two populations, regardless of their sizes. In other words, with the Gini coefficient one can directly compare the inequality in a classroom to the inequality in a country.[...]" (http://utip.gov.utexas.edu/tutorials/theo_basic_ineq_measures.doc)

http://en.wikipedia.org/wiki/Gini_coefficient#Other_uses :
"Although the Gini coefficient is most popular in economics, it can in theory be applied in any field of science that studies a distribution. For example, in ecology the Gini coefficient has been used as a measure of biodiversity, where the cumulative proportion of species is plotted against cumulative proportion of individuals.[71] In health, it has been used as a measure of the inequality of health related quality of life in a population.[72] In education, it has been used as a measure of the inequality of universities.[73] In chemistry it has been used to express the selectivity of protein kinase inhibitors against a panel of kinases.[74] In engineering, it has been used to evaluate the fairness achieved by Internet routers in scheduling packet transmissions from different flows of traffic.[75] In statistics, building decision trees, it is used to measure the purity of possible child nodes, with the aim of maximising the average purity of two child nodes when splitting, and it has been compared with other equality measures.[76]"

Also, zumindest im Falle der Gleichverteilung macht doch die good old SD keinen Sinn, weil es ja gar keine zentrale Tendenz (Mittelwert/Median etc) dort gibt. Wenn Du mich überzeugen könntest, wieso die SD d o c h Sinn macht bei einer Gleichverteilung, dann müssten wir das nochmal genauer nachlesen, oK? Aber ich hoffe, meine von Dir zitierte Behauptung ist jetzt ein wenig verständlicher? Bin gespannt auf Eure Antworten.
researcher
Beobachter
Beobachter
 
Beiträge: 13
Registriert: So 30. Sep 2012, 17:35
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: non-param. Streuungs = Dispersions = Concentrations-Maße

Beitragvon PonderStibbons » Mo 1. Okt 2012, 09:23

Also, zumindest im Falle der Gleichverteilung macht doch die good old SD keinen Sinn, weil es ja gar keine zentrale Tendenz (Mittelwert/Median etc) dort gibt.

Sicher gibt es da einen Mittelwert.

Ich verstehe leider das Raisonnement nicht recht. Die Eigenschaften der Varianz/
Standardabweichung (wie auch die eines Mittelwertes) bleiben immer dieselben,
unabhängig von der Verteilungsform. Der Mittelwert zum Beispiel ist der Wert
mit der kleinsten quadrierten Abweichungssumme zu allen Einzelwerten. Man
muss dann nur überlegen, was man mit ihm im Rahmen seiner eigenen Analyse
anfangen möchte und ob er zweckmäßig ist. Auch die Aussage, die SD sei
allgemein "sinnlos" bei nichtnormalen Verteilungen, ergibt selber keinen großen
Sinn. Es kommt auch hier darauf an, welchen Zweck der berechnete Parameter in der
eigenen Studie/Anwendung erfüllen soll. Der zitierte Gini-Koeffizient hat den Zweck,
Einommensungleichheiten im Rahmen einer politischen Betrachtung pointiert
herauszustellen. Das macht ihn in keiner Weise einer Standardabweichung
allgemein überlegen, nur eben in bestimmten Kontexten vielleicht zweckmäßiger.

Wenn bei der Auswerung von EEGs ein Entropiemaß zweckmäßiger ist als
die SD, um bestimmte Aussagen/Vergleiche/Schlußfolgerungen zu ermöglichen,
so sei es denn. Es sollten da bereits Standards existieren, wie in jedem
Anwendungsbereich, zumindest steht dies zu vermuten.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11269
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2475 mal in 2459 Posts


Zurück zu Nichtparametrische Tests

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 1 Gast