erwartete Häufigkeiten kleiner als 5 - Chi-Quadrat-Test?

erwartete Häufigkeiten kleiner als 5 - Chi-Quadrat-Test?

Beitragvon Isabeo » Sa 13. Mai 2017, 12:27

Hallo zusammen,
ich habe den Chi-Quadrat-Test angewandt, um auf Unabhängigkeit zwischen dem Zeitablauf (Merkmal 1: ausgewählte Jahre von 2001 bis 2015, insgesamt 8 Jahre) und der Betriebsgröße von Milchvieh haltenden Betrieben (Merkmal 2: vier Klassen mit jeweils 50-99, 100-199, 200-499 und 500+ Tieren) zu testen.

Folgende Fragen stelle ich mir zur Anwendung und Interpretation meiner Ergebnisse:
1. Sind meine Hypothesen richtig formuliert?
H0: Der Zeitablauf und die Entwicklung der Betriebsgröße sind voneinander unabhängig.
H1: Der Zeitablauf und die Entwicklung der Betriebsgröße sind nicht voneinander unabhängig.

2. Die erwarteten Häufigkeiten zur Berechnung der Prüfgröße liegen zwischen 1,125 und 3,875.
Ist das in Ordnung oder müsste ich die Größenklassen noch um eine weitere Klasse reduzieren, um größere Werte zu erhalten?
Man liest öfter, dass eine bestimmte Anzahl der erw. Häufigkeiten größer 1 oder größer 5 sein sollte.

3. Das Ergebnis & Interpretation:
Als Prüfgröße erhalte ich 37,405, als kritischen Wert lese ich bei 21 Freiheitsgraden und einem von mir festgesetzten SN von 0,05 aus der Tabelle den Wert 32,9706 ab.
Meine Schlussfolgerung wäre, dass ich meine Nullhypothese verwerfe, da 37 größer 32.

Ich wäre sehr froh, wenn mir ein erfahrener Statistiker eine kurze Rückmeldung gibt, ob die Anwendung und die Interpretation so richtig sind.
Mein Betreuer hat mir den Chi-Quadrat-Test als adäquaten Test für die Daten empfohlen, jedoch habe ich noch keinerlei Sicherheit in der Anwendung dieses Test...

Herzlichen Gruß
Isabell
Isabeo
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Sa 13. Mai 2017, 12:06
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: erwartete Häufigkeiten kleiner als 5 - Chi-Quadrat-Test?

Beitragvon PonderStibbons » Sa 13. Mai 2017, 14:43

ich habe den Chi-Quadrat-Test angewandt, um auf Unabhängigkeit zwischen dem Zeitablauf (Merkmal 1: ausgewählte Jahre von 2001 bis 2015, insgesamt 8 Jahre) und der Betriebsgröße von Milchvieh haltenden Betrieben (Merkmal 2: vier Klassen mit jeweils 50-99, 100-199, 200-499 und 500+ Tieren) zu testen.

Betriebgröße ist ordinal, da kannst Du einen Kruskal-Wallis H-Test mit "Jahr" als Gruppierungsvariabe und "Betriebsgröße" als abhängiger Variable rechnen. Da "Zeit" ebenfalls mindestens ordinal ist, wäre sogar eine Spearman-Rangkorrelation die geeignete Methode, die würde die Daten maximal ausnutzen (sofern die Fragestellung ist, ob die Betriebe mit der Zeit immer größer werden). Für einen Chi² sehe ich keine Erfordernis, sinnvoll durchführbar ist er hier anscheinend sowieso nicht.

2. Die erwarteten Häufigkeiten zur Berechnung der Prüfgröße liegen zwischen 1,125 und 3,875.

Das geht auf keinen Fall so. Das bläst den Chi²-Wert unrealistisch auf.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

Re: erwartete Häufigkeiten kleiner als 5 - Chi-Quadrat-Test?

Beitragvon Isabeo » Sa 13. Mai 2017, 16:21

Das bringt mich jetzt ins Grübeln, ob ich die Vorgabe meines Betreuers an der Uni, den Chi-Quadrat-Test durchzuführen, übergehen sollte?

Welche Gründe sprechen denn genau dagegen, den Chi-Quadrat-Test anzuwenden?
Mit einer guten Begründung könnte ich ja dann die von Ihnen vorgeschlagenen Verfahren anwenden...ich kann meinen Betreuer bis zur Abgabe meiner Seminararbeit nicht mehr erreichen.

Die statistischen Daten zeigen, dass die Betriebe im Zeitablauf größer werden, also Betriebe in der Klasse 50-99 nur bis 2003 noch wachsen, danach aber nur noch die in der Klasse 100-199. Somit ist die Frage, ob der zeitliche Ablauf die Zunahme an Betrieben in Klassen mit mehr Tieren bedingt...

Vergessen hatte ich noch zu erwähnen, dass ich zuvor eine Kontingenztafel angefertigen sollte.
Aus ihr kann man ablesen, wo die Wachstumsschwellen im jeweiligen Jahr liegen, sodass ich in der Summe auf die Anzahl der Bundesländer je Zeile komme.
Isabeo
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Sa 13. Mai 2017, 12:06
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: erwartete Häufigkeiten kleiner als 5 - Chi-Quadrat-Test?

Beitragvon PonderStibbons » Sa 13. Mai 2017, 17:48

Welche Gründe sprechen denn genau dagegen, den Chi-Quadrat-Test anzuwenden?

Das Skalenniveau beider Variablen ist höher als das kategoriale Skalenniveau, das der Chi2-Test verwendet. Es werden massiv Informationen verschwendet, wenn man ordianle Daten als kategoriale behandelt. Ein Chi²-Test auf Basis von 4x8 Zellen ist kaum sinnvoll interpretierbar. Ein Chi²-Test mit 32 Zellen bei einer so kleinen Stichprobe ist nicht sinnvoll durchführbar. Wenn alle Erwartungswerte < 5 sind, ist der Chi² nicht sinnvoll durchführbar. Ein H-Test oder besser noch eine Spearman-Rangkorrelation passen besser zu den Forschungsfragen.

Zu Kommunikationsproblemen mit Betreuern kann ich nichts sagen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Isabeo

Re: erwartete Häufigkeiten kleiner als 5 - Chi-Quadrat-Test?

Beitragvon Isabeo » So 14. Mai 2017, 11:57

So richtig komme ich mit der Spearman - Rangkorrelation leider nicht klar.

Sind meine Daten metrisch (Größenklasse/Intervalle) und ordinal (Jahre von 2001-2015) skaliert? Sind die Jahre nicht auch eine metrisch Variable, weil man den Abstand dazwischen messen/abzählen kann?

Wie ordne ich den Daten dann weiter die Ränge zu? Muss ich für jede der vier Größenklassen eine Rangordnung aufstellen?

Im Jahr 2001 befinden sich z.B.
8 Bundesländer in der Größenklasse 50-99,
1 Bundesland in der Größenklasse 100-199,
0 Bundesländer in der Größenklasse 200-499 und
3 Bundesländer in der Größenklasse mit 500 und mehr Tieren.

Oder ist die Zuordnung umgekehrt, dass ich ausgehend von der Kontingenztabelle die Anzahl der Bundesländer nach den Jahren in eine Rangfolge bringen muss für die 1.Klasse und dann ebenso für die 2., 3., und 4. Größenklasse?

Ich würde gerne meine Kontingenztabelle zur Veranschaulichung hier hochladen, aber habe keine Ahnung wie ich den Screenshot o.ä. hier reinbekomme...
Isabeo
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Sa 13. Mai 2017, 12:06
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: erwartete Häufigkeiten kleiner als 5 - Chi-Quadrat-Test?

Beitragvon PonderStibbons » So 14. Mai 2017, 12:35

Sind die Jahre nicht auch eine metrisch Variable, weil man den Abstand dazwischen messen/abzählen kann?

Ich schrieb, Zeit ist mindestens ordinal, das reicht für den Rangkorrelationskoeffizienten.
Wie ordne ich den Daten dann weiter die Ränge zu? Muss ich für jede der vier Größenklassen eine Rangordnung aufstellen?

Du hast n Beobachtungen (Betriebe), jede mit 2 Informationen: a) das Jahr b) die Betriebsgröße.
Entsprechend kannst Du als Datenbasis z.B. eine Tabelle mit n Zeilen (pro Betrieb eine Zeile) und 2 Spalten (für Jahr und Größe) verwenden.
Ich empfehle die Verwendung von Software, da hier immer mehrere Beobachtungen in dieselbe Größenklasse fallen, was man berücksichtigen muss. Gibt es womöglich auch als online calculator.


Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

Re: erwartete Häufigkeiten kleiner als 5 - Chi-Quadrat-Test?

Beitragvon Isabeo » So 14. Mai 2017, 15:50

Okay, dann sind also die Voraussetzungen für den Spearman Rangkorrelationskoeffizienten gegeben.

Ich habe die Daten nicht je Betrieb erfasst, das wäre für gesamt Deutschland zu umfangreich, sondern auf Ebene der Bundesländer (12 Bundesländer sollen hier berücksichtigt werden).
Daher habe ich dann 96 Datenpaare, denen ich ein Jahr und eine Größenklasse zugeordnet habe. Die Größenklassen habe ich mit 1 bis 4 nummeriert.

Im Internet konnte ich mit dem online-Kalkulator von maccery.com den Koeffizienten errechnen mit dem folgenden Ergebnis:
SRCC: 1 - ((6 x 102350)/(973-97)) = 0.32706974542394. From the SRRC (0.32706974542394), we can say that it shows that the two sets of data show weak, positive correlation.

Jedoch kann ich dort keinen Datenoutput herunterladen, sodass ich dieses Ergebnis in meiner Seminararbeit verwerten könnte.
Mit welcher frei verfügbaren Software könnte ich den Rangkorrelationskoeffizienten berechnen?
Mit Gretl scheint es nicht zu funktionieren, obwohl laut Internet die Funktion bestehen müsste. Sie wird mir jedoch nicht angezeigt unter robuste Schätzungen. Außerdem bin ich mir unsicher, in welcher Form die Daten in das Programm eingepflegt werden müssten. Als Paneldaten? Und wie muss dann die Excel-Tabelle aussehen, die ich in Gretl importiere?

Welche Software könnte ich alternativ nehmen und wie muss ich die Daten jeweils einpflegen?

Insgesamt habe ich auch nochmal die Frage zur Hypothese. Sie hatten gesagt, dass ich zeigen will, dass die Betriebe mit der Zeit größer werden. Das ist richtig, es gibt jedoch auch eine Zahl an Betrieben, die historisch bedingt im betrachteten Zeitraum immer zur Größenklasse mit den größeren Betrieben gezählt haben und die auch weiterhin dableiben mit leicht steigender Anzahl....A
Also ich will die Hypothese überprüfen, ob die Anzahl der Bundesländer in den höheren Klassen im Zeitablauf zunimmt, weiß aber, dass das nicht für alle Bundesländer zutrifft, da manche von Anfang an in Klasse 4 (größte Betriebe) sind und auch da bleiben.

Mit freundlichen Grüßen
Isabell
Isabeo
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Sa 13. Mai 2017, 12:06
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: erwartete Häufigkeiten kleiner als 5 - Chi-Quadrat-Test?

Beitragvon PonderStibbons » So 14. Mai 2017, 17:08

Ich habe die Daten nicht je Betrieb erfasst, das wäre für gesamt Deutschland zu umfangreich, sondern auf Ebene der Bundesländer (12 Bundesländer sollen hier berücksichtigt werden).

Jetzt verstehe ich leider gar nichts mehr. Wieso befindet sich ein Bundesland in der
Größenklasse (z.B.) 50-99? Es geht doch um
Betriebe
. Wie kommen da
Bundesländer ins Spiel?

Was sind das denn überhaupt für Daten, was wurde auf welche Weise konkret erhoben?
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

Re: erwartete Häufigkeiten kleiner als 5 - Chi-Quadrat-Test?

Beitragvon Isabeo » So 14. Mai 2017, 17:58

Es geht darum die Entwicklung der Wachstumsschwelle in der Milchviehhaltung festzustellen. Die Wachstumsschwelle kennzeichnet einen Grenzwert, oberhalb dessen die Anzahl der Betriebe steigt und unterhalb dessen die Anzahl der Betriebe abnimmt. Als Beispiel: im Jahr 2015 lag die Wachstumsschwelle für die Hälfte der Bundesländer bei 100-200 Milchkühen. Betriebe, die weniger als 100 Kühe haben, haben im Vergleich zu 2013 abgenommen und Betriebe mit mehr als 200 Kühen haben zahlenmäßig zugenommen.

Es erfolgt eine Aufteilung nach Bundesländern, da die statistischen Landesämter auf diesem Level die Erhebungen durchführen und bundesweit je nach Region große strukturelle Unterschiede bestehen.

Zunächst habe ich dazu die Anzahl der Betriebe in den einzelnen Größenklassen vom Statistischen Bundesamt für die Jahre 2001, 2003, 2005, 2007, 2010, 2011, 2013, und 2015 (nach Bundesländern aggregiert) aufgeschrieben, sodass ich 12 Tabellen (Tabelle je Bundesland) erhalte. In jeder Zeile habe ich dann die Wachstumsschwelle markiert.

In einem zweiten Schritt sollte ich laut meinem Betreuer alle Wachstumsschwellen für die einzelnen Jahre in eine Kontingenztabelle überführen.
In dieser sieht man dann, dass die Wachstumsschwelle im Jahr 2001 für 8 Bundesländer in der Klasse 50-99 Kühe, für 1 Bundesland in der Klasse 100-199 und für 3 Bundesländer in der Klasse mit Betrieben mit mehr als 500 Kühen lag. Im Jahr 2015 wird der Strukturwandel in der Landwirtschaft dann deutlich: die Anzahl der Betriebe hat abgenommen und zugleich hat sich die Wachstumsschwelle in die Klasse 100-199 verschoben ( 6 BL haben die Wachstumsschwelle in jener Klasse; 5 sogar in größeren Klassen).

Mit dem Chi-Quadrat-test sollte ich nun zeigen, laut meinem Betreuer, dass das zeitliche Voranschreiten mit der Verschiebung der Wachstumsschwelle in die Klassen mit mehr Tieren/Betrieb nicht unabhängig voneinander geschieht.

Ganz prinzipiell geht es in der Seminararbeit darum einen vorgegebenen Sachverhalt statistisch darzustelllen.
Isabeo
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Sa 13. Mai 2017, 12:06
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: erwartete Häufigkeiten kleiner als 5 - Chi-Quadrat-Test?

Beitragvon PonderStibbons » Mo 15. Mai 2017, 08:29

Jedes Bundesland kommt 8mal vor, wird 8mal hinsichtlich der abhängigen Variable "gemessen". Damit handelt es sich nicht mehr um unabhängige Beobachtungen, sondern je 8 sind innerhalb eines Landes geclustert. Der Chi²-Test jedoch setzt voraus, dass die Beobachtungen unabhängig sind. Ich finde daher die Vorgaben durch Deinen Betreuer immer schwerer nachzuvollziehen.

Eine krude, aber solide Möglichkeit mit solchen Daten umzugehen, wäre innerhalb jedes Bundeslandes die Korrelation zwischen Jahr und Wachstumsschwelle zu berechnen. Diese Bundesland-bezogenen Korrelationen müsste man dann im zweiten Schritt geeignet zusammenfassen. Ein robustes Maß für die zentrale Tendenz wäre dann der Median aus den 15 (?) einzelnen Korrelationen.

Alternativ könnte man für jedes Jahr die mittlere (mediane) Wachstumsschwelle über die 15 (?) Bundesländer berechnen und diese medianen Wachstumschwellen mit dem Jahr korrelieren. Also eine Korrelationsanalyse mit 8 "Fällen" (Jahren).

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

Nächste

Zurück zu Kreuztabellen & Chi²

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste