Chi-Quadrat-Unabhängigkeitstest kleine Zahlenwerte

Chi-Quadrat-Unabhängigkeitstest kleine Zahlenwerte

Beitragvon LeniB » Mo 14. Nov 2016, 16:13

Hallo,

ich bin neu hier und hoffe, ihr könnt mir bei meiner Statistik helfen. Ich will mein Thema etwas allgemein halten, lasst mich wissen, falls man es nicht nachvollziehen kann.

Ich habe 100 Teilnehmer und ich habe bei jedem dieser Teilnehmer die Ausprägung eines bestimmten Faktor A gemessen. Die Ausprägung wurde mit Zahlenwerten angegeben, die jetzt in meinem Fall zwischen 5-30 lagen (also Verhältnisskala). Ich habe die 100 Teilnehmer in 5 Untergruppen anhand eines anderen Faktors B unterteilt (sowas wie blau, grün, rot...also Nominalskala), diese Untergruppen sind unterschiedlich groß, zwischen 5 - 35 Teilnehmern pro Untergruppe. Ich möchte testen, ob der Faktor B dieser Teilnehmer die Ausprägung des Faktors A beeinflusst, also zB ob man sagen kann, bei den Teilnehmern mit diesem Faktor B war die Ausprägung des Faktors A am größten.

Ich habe auch die Mittelwerte getestet, aber mein Hauptanliegen ist dieses: Um besser und verständlicher zu argumentieren, haben wir einen Cutoff bei der Ausprägung des Faktors A bei 3 gesetzt, da das der Wert ist, den wir pro Untergruppe erwartet hätten, wenn die Ausprägungen gleichmäßig verteilt gewesen wären (Mittelwert=15 geteilt durch 5 Untergruppen). Und wir haben uns den ANTEIL der Teilnehmer in den Untergruppen angeschaut, deren Ausprägung größer oder kleiner als 3 war, um sagen zu können - bei der Untergruppe mit demjenigen Faktor B gab es mehr Teilnehmer mit einer höheren Ausprägung (also >3) als bei den anderen vier Untergruppen.

Man kann meinen Sachverhalt so eigentlich ganz anschaulich beschreiben, aber jetzt bräuchte ich noch einen statistischen Test, um die Aussagen mit Signifikanzniveaus zu unterlegen. Und das ist mein Problem - was kann ich da nehmen? Ich habe den chi-Quadrat-Test gemacht, so sah die Tabelle aus:

Anzahl Teilnehmer mit Ausprägung <3 Anzahl Teilnehmer mit Ausprägung >3
Faktor B - 1 (Zahl) (Zahl)
Faktor B - 2 (Zahl) (Zahl)
Faktor B - 3 (Zahl) (Zahl)
Faktor B - 4 (Zahl) (Zahl)
Faktor B - 5 (Zahl) (Zahl)

Macht das soweit Sinn?

Mein zweites Problem: Ich habe das alles nicht nur 1 mal für den Faktor A gemacht, sondern insgesamt 20 Mal für weitere Faktoren A. Ich hatte oft niedrige Teilnehmerzahlen in der Gruppe mit Ausprägung <3, manchmal sind 2-3 Zahlenwerte gleich 0 und oft sind die Zahlenwerte zwischen 1-5. Ich konnte einfach nicht herausfinden/verstehen, was man in einem solchen Fall machen kann? Ich kann eigentlich keine der Untergruppen des Faktors B zusammenfassen, das macht keinen Sinn. Gibt es alternative Tests, die man mit PRISM oder SPSS machen könnte? Was macht man allgemein in einer Arbeit, wenn man den chi-Quadrat-Test nicht für den gesamten Datensatz machen kann - komplett weglassen oder schreiben, wir konnten den Test leider nur für einen Teil durchführen?

Ich bin euch sehr dankbar für Antworten oder Anregungen, was ich besser machen könnte!
LeniB
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Sa 12. Nov 2016, 18:58
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Chi-Quadrat-Unabhängigkeitstest kleine Zahlenwerte

Beitragvon PonderStibbons » Mo 14. Nov 2016, 16:41

Ich habe 100 Teilnehmer und ich habe bei jedem dieser Teilnehmer die Ausprägung eines bestimmten Faktor A gemessen.

Was ist das konkret für ein "Faktor A", worum geht es bei der ganzen Sache?
Die Ausprägung wurde mit Zahlenwerten angegeben, die jetzt in meinem Fall zwischen 5-30 lagen (also Verhältnisskala).

Was bedeuten konkret diese Zahlenwerte?
Ich habe die 100 Teilnehmer in 5 Untergruppen anhand eines anderen Faktors B unterteilt (sowas wie blau, grün, rot...also Nominalskala),

Was ist konkret der Faktor B, was sind das für Gruppen?
Um besser und verständlicher zu argumentieren, haben wir einen Cutoff

Cutoffs machen normalerweise nichts besser oder verständlicher, sie vernichten
lediglich statistische Informationen und führen im schlimmeren Fall zu irreführenden
oder verzerrten Ergebnissen.
bei der Ausprägung des Faktors A bei 3 gesetzt, da das der Wert ist, den wir pro Untergruppe erwartet hätten, wenn die Ausprägungen gleichmäßig verteilt gewesen wären (Mittelwert=15 geteilt durch 5 Untergruppen).

Das ergibt für mich so überhaupt keinen Sinn. Aber die ganzen
Hintergrundinformationen fehlen.

Ich habe den chi-Quadrat-Test gemacht

Der ist dafür da, den Zusammenhang zweier kategorialer Merkmale
zu testen, insofern ist er hier durchführbar.

Mein zweites Problem: Ich habe das alles nicht nur 1 mal für den Faktor A gemacht, sondern insgesamt 20 Mal für weitere Faktoren A. Ich hatte oft niedrige Teilnehmerzahlen in der Gruppe mit Ausprägung <3, manchmal sind 2-3 Zahlenwerte gleich 0 und oft sind die Zahlenwerte zwischen 1-5. Ich konnte einfach nicht herausfinden/verstehen, was man in einem solchen Fall machen kann? Ich kann eigentlich keine der Untergruppen des Faktors B zusammenfassen, das macht keinen Sinn. Gibt es alternative Tests, die man mit PRISM oder SPSS machen könnte? Was macht man allgemein in einer Arbeit, wenn man den chi-Quadrat-Test nicht für den gesamten Datensatz machen kann - komplett weglassen oder schreiben, wir konnten den Test leider nur für einen Teil durchführen?

Verstehe leider kein Wort.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11256
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2471 mal in 2455 Posts

Re: Chi-Quadrat-Unabhängigkeitstest kleine Zahlenwerte

Beitragvon LeniB » Mo 14. Nov 2016, 17:01

Vielen Dank schon Mal für die schnelle Antwort! Ich wollte nicht so ins Detail meiner Arbeit gehen, habe aber trotzdem auf Hilfe zu der Statistik gehofft.

Ich versuche es nochmal - Faktor A sind letztendlich bestimmte Punkte im Auge, die ich bei den Teilnehmern gemessen habe - manche hatten 5, manche 30 oder etwas dazwischen. Die Untergruppen anhand des Faktors B waren z.B. blaue Augen, also ich hatte 5 Teilnehmer mit blauen Augen, von diesen hatte Nummer 1 12 gemessene Punkte, Nummer 2 5 gemessene Punkte, Nummer 3 28 gemessene Punkte usw., oder sie hatten grüne Augen, braune Augen... Die Untergruppen waren nicht gleich groß. Ist das verständlich?

Zum zweiten Punkt: was kann ich machen, wenn ich den chi-Quadrat-Test nicht machen sollte, weil die Zahlenwerte klein sind oder bei 0 liegen? Und ich Die Untergruppen nicht zusammenfassen kann (weil es keinen Sinn macht braune und blaue Augen in eine Gruppe zu fassen)? Gibt es eine Alternative, die mit PRISM oder SPSS durchführbar ist?

Gibt es noch Sachen, die man nicht versteht?
LeniB
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Sa 12. Nov 2016, 18:58
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Chi-Quadrat-Unabhängigkeitstest kleine Zahlenwerte

Beitragvon PonderStibbons » Mo 14. Nov 2016, 17:16

Ich wollte nicht so ins Detail meiner Arbeit gehen, habe aber trotzdem auf Hilfe zu der Statistik gehofft.

"Nicht ins Detail gehen" ist was anderes als die erforderlichen Informationen zu unterschlagen.

Zum zweiten Punkt: was kann ich machen, wenn ich den chi-Quadrat-Test nicht machen sollte, weil die Zahlenwerte klein sind

Was für Zahlenwerte meinst Du? Die Originalmessungen irgendwelcher Punkte, also deren Anzahl? Die wolltest Du doch ohnedies kategorisieren.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11256
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2471 mal in 2455 Posts

Re: Chi-Quadrat-Unabhängigkeitstest kleine Zahlenwerte

Beitragvon LeniB » Mo 14. Nov 2016, 17:24

Vielen Dank! Im chi-Quadrat Test habe ich bereits die kategorisierten Daten verwendet, also in der ersten Spalte die Anzahl der Patienten, die mehr als 3 Punkte hatten, und in der zweiten Spalte die Anzahl der Patienten die weniger als 3 Punkte hatten. In den Zeilen waren die fünf Untergruppen (blaue Augen, braune ...). Die Tabelle sah dann zum Beispiel so aus:
10 2
8 4
12 0
9 3
12 0
Ich würde gerne wissen, welche Möglichkeiten ich habe, mit der Tatsache umzugehen, dass zwei der Werte null sind und die Werte in der rechten Spalte zwischen 1-5 liegen.
LeniB
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Sa 12. Nov 2016, 18:58
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Chi-Quadrat-Unabhängigkeitstest kleine Zahlenwerte

Beitragvon PonderStibbons » Di 15. Nov 2016, 13:26

Ich würde gerne wissen, welche Möglichkeiten ich habe, mit der Tatsache umzugehen, dass zwei der Werte null sind

Was meinst Du mit §umgehen"? Null ist Null, das ist für sich genommen doch kein Problem.
Allerdings hast Du insgesamt viel zu wenig Fälle für die insgesamt 10 Zellen, daher wird der
Chi²-Test nicht gehen. Wieso sind es nur ca. 50 statt der ursprünglich angegebenen 100?

und die Werte in der rechten Spalte zwischen 1-5 liegen.

Was meinnt Du damit? In Deinem Beispiel liegen sie in der rechten Spalte zwischen 0 und 4.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11256
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2471 mal in 2455 Posts

Re: Chi-Quadrat-Unabhängigkeitstest kleine Zahlenwerte

Beitragvon bele » Di 15. Nov 2016, 13:49

Bei kleinen Zellenbesetzungen kann ggf. ein Fisher-Test helfen. Ich weiß nur, dass der früher in SPSS nur bedingt verfügbar war, daher demonstiere ich schnell mal, wie man den in R rechnet. Das ändert nichts daran, dass da 40 von hundert Datensätzen zu fehlen scheinen. Oder habt Ihr die mit genau 3 Punkten wirklich weggelassen, wie es der Text andeutet?
in der ersten Spalte die Anzahl der Patienten, die mehr als 3 Punkte hatten, und in der zweiten Spalte die Anzahl der Patienten die weniger als 3 Punkte hatten
Wenn ja, würde ich das gerne nochmal hinterfragen wollen.

Fisher-Test in R:
Code: Alles auswählen
> A <- matrix(c(10, 2, 8, 4, 12, 0, 9, 3, 12, 0), byrow = TRUE, ncol=2)
> A
     [,1] [,2]
[1,]   10    2
[2,]    8    4
[3,]   12    0
[4,]    9    3
[5,]   12    0
> fisher.test(A)

   Fisher's Exact Test for Count Data

data:  A
p-value = 0.05687
alternative hypothesis: two.sided


Wenn es sehr viele Faktoren gibt, dann muss man auch über das Thema Alphafehlerkummulation einmal nachdenken.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5772
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1354 mal in 1341 Posts

Re: Chi-Quadrat-Unabhängigkeitstest kleine Zahlenwerte

Beitragvon LeniB » Mi 16. Nov 2016, 09:32

Hi, vielen Dank für die hilfreiche Antwort, bele! Ich hatte dann glücklicherweise privat schon jemanden gefunden, der mir das gleiche empfahl und mir den Fisher exact test erklärt hatte. Ich dachte, ich kann den Fisher exact test nicht machen, weil ich mehr als 2x2 Felder habe, und bei PRISM konnte ich ihn nicht auswählen. Bei SPSS war es auch wirklich etwas aufwändig, herauszufinden, wie ich den machen kann, aber einmal herausgefunden, klappt es gut.

Also jetzt meinerseits Rat an alle, die das gleiche Problem hatten wie ich - Fisher exact geht auch bei mehr als 2x2 Feldern, in PRISM kann man ihn nicht machen, aber in SPSS geht es (wenigstens in Version 20) schon. Außerdem gibt es online-Kalkulatoren für verschiedene Feldergrößen, als Notfalllösung.

Die p-Werte der chi-quadrat-Tests und des Fisher Tests unterscheiden sich bei mir auch nur geringfügig, also alles gut.

Nein, wir haben nicht die mit 3 Punkten weggelassen, es war größer gleich 3 und kleiner 3. Es handelte sich bei dem Beispiel nur um eine Untergruppe der 100 Teilnehmer. Ich habe das gleiche für die 100 Teilnehmern auch gerechnet, aber da hatte ich ausreichend Große zahlen, deswegen habe ich hier ein anderes Beispiel genannt.

Ja, es gibt schon viele Faktoren. Danke für den Tipp, ich lese mich in die alphafehlerkummulation mal ein!
LeniB
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Sa 12. Nov 2016, 18:58
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Kreuztabellen & Chi²

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste