Signifikanztests? Chi-Quadrat-Test?
Verfasst: Mo 2. Aug 2021, 19:02
Liebes Forum,
ich möchte die Produktion von Nebensätzen im Zweitspracherwerb analysieren. Dazu habe ich insgesamt 853 Nebensätze aus 15 Texten von Lernenden auf B2-Niveau + 15 Texten von Lernenden auf C1-Niveau untersucht und nach verschiedenen nominal skalierten Kriterien (z.B. Verbstellung, syntaktische Funktion usw.) klassifiziert. Jetzt würde ich mir gerne ansehen, ob es Unterschiede zwischen den B2- und C1-Texten gibt (z.B. ob in den C1-Texten die Verbstellung korrekter ist als in den B2-Texten).
Ich habe schon ein paar nette Kreuztabellen erstellt, verzweifle aber momentan an der Interpretation - konkret weiß ich nicht, wie ich einschätzen kann, ob meine Ergebnisse statistisch signifikant sind. Wenn ich es richtig verstehe, benutzt man dazu normalerweise Chi-Quadrat-Tests. Da gibt es bei mir aber 2 Probleme: Erstens sind die zu erwartenden Häufigkeiten teilweise kleiner als 5 (habe im Internet gelesen, dass das ungünstig sei), und zweitens weichen innerhalb derselben Kreuztabelle manche Werte stark vom erwarteten Wert ab, manche dafür gar nicht - hier wäre es doch sinnvoll, wenn ich nicht die ganze Kreuztabelle teste, sondern nur einzelne Felder, oder? Geht das überhaupt?
Ein Beispiel: Bei der Variable "Funktion" gibt es die Ausprägungen "Komplementsatz", "Adverbialsatz", "Attributsatz" und "weiterführender Nebensatz". Die B2- und C1-Texte haben einen annähernd gleich großen Anteil an Komplementsätzen (38,60% vs. 38,88%), dafür unterscheiden sie sich aber (meines Erachtens) bei den Adverbial- und Attributsätzen (30,83% vs. 35,06% / 30,57% vs. 25,84%). Ein weiterführender Nebensatz wurde überhaupt nur ein einziges Mal produziert.
Wie kann ich an diese Daten nun herangehen? Welche(r) Test(s) wären empfehlenswert?
Vielen Dank im Voraus!
ich möchte die Produktion von Nebensätzen im Zweitspracherwerb analysieren. Dazu habe ich insgesamt 853 Nebensätze aus 15 Texten von Lernenden auf B2-Niveau + 15 Texten von Lernenden auf C1-Niveau untersucht und nach verschiedenen nominal skalierten Kriterien (z.B. Verbstellung, syntaktische Funktion usw.) klassifiziert. Jetzt würde ich mir gerne ansehen, ob es Unterschiede zwischen den B2- und C1-Texten gibt (z.B. ob in den C1-Texten die Verbstellung korrekter ist als in den B2-Texten).
Ich habe schon ein paar nette Kreuztabellen erstellt, verzweifle aber momentan an der Interpretation - konkret weiß ich nicht, wie ich einschätzen kann, ob meine Ergebnisse statistisch signifikant sind. Wenn ich es richtig verstehe, benutzt man dazu normalerweise Chi-Quadrat-Tests. Da gibt es bei mir aber 2 Probleme: Erstens sind die zu erwartenden Häufigkeiten teilweise kleiner als 5 (habe im Internet gelesen, dass das ungünstig sei), und zweitens weichen innerhalb derselben Kreuztabelle manche Werte stark vom erwarteten Wert ab, manche dafür gar nicht - hier wäre es doch sinnvoll, wenn ich nicht die ganze Kreuztabelle teste, sondern nur einzelne Felder, oder? Geht das überhaupt?
Ein Beispiel: Bei der Variable "Funktion" gibt es die Ausprägungen "Komplementsatz", "Adverbialsatz", "Attributsatz" und "weiterführender Nebensatz". Die B2- und C1-Texte haben einen annähernd gleich großen Anteil an Komplementsätzen (38,60% vs. 38,88%), dafür unterscheiden sie sich aber (meines Erachtens) bei den Adverbial- und Attributsätzen (30,83% vs. 35,06% / 30,57% vs. 25,84%). Ein weiterführender Nebensatz wurde überhaupt nur ein einziges Mal produziert.
Wie kann ich an diese Daten nun herangehen? Welche(r) Test(s) wären empfehlenswert?
Vielen Dank im Voraus!