Einbeziehung von formalen Kategorien?

Alles rund um Clusteranalysen.

Einbeziehung von formalen Kategorien?

Beitragvon KoWiNils » Di 31. Okt 2023, 13:31

Hallo zusammen,

ich habe für meine Bachelorarbeit eine quantitative Inhaltsanalyse von Artikeln zweier Publikationen durchgeführt. Hierfür habe ich sowohl formale Variablen (Artikelnummer, Datum der Veröffentlichung, Publikation etc) und inhaltliche Variablen (Akteure, Chancen, Risiken etc) codiert.
Um nun Frames identifizieren zu könnnen will ich eine hierarchische Clusteranalyse mit dem Ward-Verfahren durchführen. Hierbei stellt sich mir aktuell noch die Frage, ob ich bei der Analyse dann auch die formalen Kategorien clustern soll oder diese später erst betrachtet werden?
Als Zusatzinfo: Die formalen Kategorien sind zB beim Datum als 20231031, oder bei Format von 1-5 skaliert. Die inhaltlichen Kategorien hingegen sind alle binär (0 = nicht vorhanden, 1 = vorhanden)

Danke schon mal im voraus!
KoWiNils
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Do 5. Okt 2023, 20:10
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Einbeziehung von formalen Kategorien?

Beitragvon PonderStibbons » Di 31. Okt 2023, 14:04

Was können wir dazu sagen? Entweder der Einbezug von Artikelnummer, Datum der Veröffentlichung, Publikation etc
trägt aus Deiner Sicht zum Ziel Frames identifizieren bei, oder eben nicht.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11276
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts

Re: Einbeziehung von formalen Kategorien?

Beitragvon KoWiNils » Di 31. Okt 2023, 14:25

Mich interessiert in dem Zusammenhang vor allem die statistische Machbarkeit.
Also ob es zB Nachteile mit sich bringen würde, unterschiedlich skalierte Variablen innerhalb eines Clusterverfahrens zu verwenden.
Von Interesse wäre die jeweilige Publikation etc. natürlich schon, wegen meiner eingeschränkten Grundlagen-Kenntnisse bin ich mir aber bisher nicht sicher, ob eine getrennte Betrachtung statistisch sinniger wäre.

PonderStibbons hat geschrieben:Was können wir dazu sagen? Entweder der Einbezug von Artikelnummer, Datum der Veröffentlichung, Publikation etc
trägt aus Deiner Sicht zum Ziel Frames identifizieren bei, oder eben nicht.

Mit freundlichen Grüßen

PonderStibbons
KoWiNils
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Do 5. Okt 2023, 20:10
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Einbeziehung von formalen Kategorien?

Beitragvon bele » Di 31. Okt 2023, 15:14

Wenn ich die Frage richtig verstehe dann geht es doch darum, ob die Distanzfunktion sinnvoll formuliert werden kann. Wenn eine inhaltliche Kategorie sich von vorhanden zu nicht vorhanden ändert, dann ist das in dieser Variablen eine Veränderung von 1. Wenn das Format sich von 1 auf 4 ändert, dann ist das ein dreimal so großer Schritt. Das macht im Gesamtkontext entweder Sinn oder nicht. Denkbar wäre es, einzelne Variablen zu skalieren. Also das Format beispielsweise nicht als 1,2,3,4,5 sondern als 1.0, 1.2, 1.4, 1.6, 1.8, 2.0 zu codieren. Dann wäre ein vollständiger Kategorienwechsel soviel wie ein vollständiger Formatwechsel. Auch hier gilt: Das macht im Gesamtbild entweder Sinn, oder eben nicht.

Dann hoffe ich dass die Datumsangabe "20231031" nicht für die Zahl Zwanzigmillionenzweihunderteinunddreizigtausendeinunddreißig steht. Wenn doch, dann würde ich dringend raten, das anders zu codieren. Sonst ist der Abstand zwischen dem letzten Tag im Februar und dem ersten im März größer als der zwischen dem letzten Tag im März und dem ersten im April. Glaube nicht, dass das irgendwo Sinn machen würde.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5789
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1360 mal in 1347 Posts

folgende User möchten sich bei bele bedanken:
KoWiNils

Re: Einbeziehung von formalen Kategorien?

Beitragvon PonderStibbons » Di 31. Okt 2023, 15:18

Also ob es zB Nachteile mit sich bringen würde, unterschiedlich skalierte Variablen innerhalb eines Clusterverfahrens zu verwenden.

Das solle sich aus der Beschreibung des Verfahrens ergeben, die Du gelesen hast? Gemischte Skalenniveaus gehen mit hierarchischen Clusteranalysen nicht.
Aber man kann als Behelf aus einer ordinalen oder interallskalierten Variable ein Anzahl binärer Variablen machen, was auch schon bei "Publikation"
erforderlich wäre, sollte diese mehr als 2 Kategorien haben. Bei "Artikelnummer, Datum der Veröffentlichung" wird das noch umständlicher, ist aber
prinzipiell machbar, wenn es dem Auswertungszweck dient.
Von Interesse wäre die jeweilige Publikation etc. natürlich schon, wegen meiner eingeschränkten Grundlagen-Kenntnisse bin ich mir aber bisher nicht sicher, ob eine getrennte Betrachtung statistisch sinniger wäre.

"statistisch sinnig" sagt mir leider nichts und ich weiß nicht was "getrennte Betrachtung" hier konkret für Dich bedeutet. Entweder willst Du Cluster,
welche diese Merkmale mit enthalten oder nicht. Mein Hinweis war, dass Du selber wissen musst, ob "Frames identifizieren" bedeutet, dass auch
"Artikelnummer, Datum der Veröffentlichung, Publikation etc" dazugehören. Klingt keinesfalls so, aber ich kenne den Hintergrund und die
Fragestellung/Ziele der Studie nicht.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11276
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts


Zurück zu Clusteranalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste