Seite 1 von 1

Zusammenhangsmaß normalisierte Häufigkeiten

BeitragVerfasst: Sa 2. Mai 2020, 17:11
von jboben
Hallo allerseits,

habe eine Frage bezüglich eines korpuslinguistischen Themas, ich hoffe irgendjemand kann mir weiterhelfen oder hat zumindest eine Idee, in welche Richtung ich hier gehen könnte.

Für meine Masterarbeit analysiere ich politische Metaphern im Brexit-Diskurs und habe dazu ein binationales Zeitungskorpus mit ca. 1 Mio. Wortformen (Deutschland) sowie 4 Mio. Wortformen (Großbritannien) zusammengestellt, insgesamt also 5 Mio. Wörter. Zusätzlich unterscheide ich zwischen Qualitäts- und Boulevardmedien. Eine meiner Hypothesen ist, dass Boulevardmedien kreativere Metaphern (Kreativität gemessen durch einen Score mit Werten 1 (sehr konventionell) -7 (sehr kreativ)) als Qualitätsmedien gebrauchen, da sie meistens sensationalistischer in ihrer Berichterstattung sind.

Gesetzt den Fall ich möchte jetzt meine Hypothese überprüfen und ich teile die Metaphern hierzu abermals in zwei Gruppen (Konventionell = Score kleiner als 4, kreativ Score größer gleich 5) ein, wie kann ich hier vorgehen? Eine Vierfeldmatrix zur Durchführung eines Chi²-Test ist hier nicht möglich, da der Test nur mit absoluten Häufigkeiten funktioniert, die Werte aber zusätzlich an den jeweiligen Korpusgrößen (deutsch- und englischsprachiges Korpus stehen in einem Verhältnis von 1:4 bez. Wortumfang) normalisiert werden müssten. Zusätzlich hierzu müsste auch irgendwie die Dysbalance zwischen Qualitäts- und Boulevardmedien berücksichtigt werden (die Datenbasis ist auch hier nicht ausgewogen), oder?

Kann mir hier jemand weiterhelfen? Wäre supi :)

Danke und viele Grüße

Re: Zusammenhangsmaß normalisierte Häufigkeiten

BeitragVerfasst: Sa 2. Mai 2020, 17:22
von bele
Welche Hypothese willst Du prüfen? In der beschriebenen kommen die beiden Sprachen nicht vor, in der Problembeschreibung aber schon?

LG,
Bernhard

Re: Zusammenhangsmaß normalisierte Häufigkeiten

BeitragVerfasst: Sa 2. Mai 2020, 21:00
von jboben
Meine Hypothese lautet, dass Boulevardmedien sich durch einen kreativeren Metapherngebrauch auszeichnen als Qualitätsmedien. Das heißt eigentlich müsste ich die beiden Korpora poolen und dann quasi quer zu den Sprachen jeweils innerhalb der Gruppen Qualitätsmedien (D+UK) sowie Boulevardmedien (D+UK) die Verteilungen kreativerer und weniger kreativer Bildungen vergleichen. Oder ich überprüfe die Hypothese zweimal, nach Sprache getrennt...was meinst du?

Danke und LG

Re: Zusammenhangsmaß normalisierte Häufigkeiten

BeitragVerfasst: Sa 2. Mai 2020, 21:59
von bele
jboben hat geschrieben: Oder ich überprüfe die Hypothese zweimal, nach Sprache getrennt...was meinst du?


Die Frage solltest Du vielleicht eher einem Linguisten stellen. Meine Kompetenz betrifft eher die Versorgung kleiner Kinder mit Hörgeräten.
Wenn Du für jede Sprache einen Test machen willst, wäre ein Rangsummentest nach Wilcoxon eine Option. In einem Test die Sprache berücksichtigen, da bist Du recht schnell bei einer ordinalen logistischen Regression.

Die Unterteilung der Metapherwerte in zwei Gruppen würde ich tendenziell sein lassen; es sei denn, es gäbe gute linguistische Gründe dafür.

LG,
Bernhard

Re: Zusammenhangsmaß normalisierte Häufigkeiten

BeitragVerfasst: Sa 2. Mai 2020, 23:22
von jboben
Ich habe schon im Kreis meiner Kommilitonen herumgefragt, da sind aber leider die wenigsten so wirklich bewandert in der Hinsicht...ich guck mir aber auf jeden Fall mal den Wilcoxon-Test an.

Hey, danke dir auf jeden Fall!

Lg
Jakob