Cluster alternative zum MedianSplit?

Alles rund um Clusteranalysen.

Cluster alternative zum MedianSplit?

Beitragvon Roboter » Di 21. Jul 2015, 12:12

Hallo liebe Statistiker,

In einem Artikel von Maccullum (2002)* habe ich mich über die Nachteile des Medianssplit-Verfahrens aufklären lassen, wenn man es zur Dichotomisierung einer Variable nutzt. Ich möchte in den mir vorliegenden Daten gerne eine alternative wählen, um Gruppen zu bilden, die ich dann miteinander vergleichen kann. Es wäre toll, wenn die Gruppeneinteilung über statistische Verfahren (Cluster-Analyse, Taxonometrische Verfahren, Faktorenanaylse...) möglich ist. Die Daten stammen aus einem Exp. mit within-participant-design und ein Spatial Ability Test wurde erhoben, um einen vermuteten (H1) zusammenhang zwischen dieser UV und den AVs nachzuweisen.


Daten (n=33):
UV: Spatial Ability Test-Score [1,2,3..-15] (ordinal)

Bei den AVs handelt es sich um Häufigkeiten. Probanden haben in jedem Exp.Trial eine 1(ja) oder eine 0(nein) für alle 4 AVs erhalten. Die Werte die ich nun für die Analyse verwenden möchte, sind agglomerationen über das gesamte Experiment. Ist AV1 von Proband x also 4, so hat er/sie in z.B. 32 Prozent der Trials dieses Merkmal erhalten, sein wert wäre dann 0.32. Er gibt also an wie häufig eine VP eine bestimmte response innerhalb des gesamten experiments gegeben hat. Die AVs schließen sich dabei nicht gegenseitig aus, d.h. es ist möglich das ein Proband in einem Trial x in allen AVs eine 1 hat, weil sein Verhalten alle Merkmale aufweist.
AV1: x [Häufigkeit: prozent z.b 0.23] (interval)
AV2: y [Häufigkeit: prozent z.b 0.23] (interval)
AV3: z [Häufigkeit: prozent z.b 0.23] (interval)
AV4: k [Häufigkeit: prozent z.b 0.23] (interval)

Züruck zur Frage nach dem Zusammenhang zwischen AV und UV. Welches ist hier das beste Verfahren um einen Zusammenhang nachzuweisen? Meine erste Intuition ist eine einfache Spearman-Korrelations Matrix. Hier ist jedoch die Frage, ob das genug ist? Schließlich können die Korrelationen eine koinzidenz sein oder über eine andere (unbekannte) variable vermittelt werden. Was schlagt ihr hier vor?

Die zweite Frage ist nun, ob es einen empirischen Mehrwert hat, wenn ich die Probanden in Gruppen einteilen, um daraufhin mit einem signifikanztest (kruskal wallis bzw. man-whitney) zu überprüfen ob sie aus der gleichen population stammen.
Nun kommen wir zu der oben gestellten Frage. Dazu müsste ich alle Probanden in 2-3 Gruppen einteilen, wobei ein Mediansplit völlig unerklärbar wäre (siehe artikel Maccullum für genaueres). Kann ich über eine Cluster-Analyse oder ein anderes Verfahren eine bessere Einteilung aller Probanden in Gruppen vornehmen? Oder macht es eurer Meinung nach keinen Sinn hier eine Gruppeneinteilung vorzunehmen?
Ich wäre sehr dankbar über Hinweise, Tipps , Kritik und alles was euch einfällt.

Grüsse,
Euer Roboter

*(MacCallum, R. C., Zhang, S., Preacher, K. J., & Rucker, D. D. (2002). On the practice of dichotomization of quantitative variables. Psychological methods, 7(1), 19.)
Roboter
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 21. Jul 2015, 11:26
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Cluster alternative zum MedianSplit?

Beitragvon PonderStibbons » Di 21. Jul 2015, 13:52

Die zweite Frage ist nun, ob es einen empirischen Mehrwert hat, wenn ich die Probanden in Gruppen einteilen, um daraufhin mit einem signifikanztest (kruskal wallis bzw. man-whitney) zu überprüfen ob sie aus der gleichen population stammen.

Worin sollte denn ein Mehrwert bestehen, wenn Du Informationen vernichtest,
um die Variable in eine kategoiale zu verwandeln und Du statt einer Korrelation
nur einen Gruppenvergleich rechnest? Ich verstehe den leider den Ursprung und
den Zweck dieser Überlegung nicht.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11256
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2471 mal in 2455 Posts

Re: Cluster alternative zum MedianSplit?

Beitragvon Roboter » Di 21. Jul 2015, 14:54

Worin sollte denn ein Mehrwert bestehen, wenn Du Informationen vernichtest,
um die Variable in eine kategoiale zu verwandeln und Du statt einer Korrelation
nur einen Gruppenvergleich rechnest?


erstmal danke für die rasche antwort.
Ich gebe Dir recht, dass zunächst erstmal kein Mehrwert darin besteht diese Informationen zu vernichten. Die zu grunde liegende Idee ist es sich nach Aufteilung in die jeweiligen Gruppen, die verteilung der AVs anzuschauen und nach unterschieden zu schauen. Vielleicht haben Probanden mit hohem spatial skill, eine negative korrelation zu AV1, und probanden mit niedrigem spatial skill eine positive korrelation zu AV1. Nur als gesamte gruppe untersucht, existiert jedoch keine korrelation.

VG!

Nachtrag: Ein weiter Grund wäre, weil man die Ergebnisse anschaulicher darstellen kann. Die Frage ist nur mit welchen Verfahren erhält man eine standfeste, erklärbare Gruppierung.
Roboter
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 21. Jul 2015, 11:26
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Cluster alternative zum MedianSplit?

Beitragvon PonderStibbons » Di 21. Jul 2015, 20:25

Vielleicht haben Probanden mit hohem spatial skill, eine negative korrelation zu AV1, und probanden mit niedrigem spatial skill eine positive korrelation zu AV1. Nur als gesamte gruppe untersucht, existiert jedoch keine korrelation.

Verstehe ich nicht. Du vermutest, dass die Korrelation nicht linear
ist? Das kannst Du doch als y = b1*x + b2*x² + e modellieren (die
UV scheint als annähernd intervallskaliert behandelbar zu sein).

Nachtrag: Ein weiter Grund wäre, weil man die Ergebnisse anschaulicher darstellen kann.

Streudiagramm.

VG!

wtf

Mit freundlichen Grüßen

P.


Nachtrag: Ein weiter Grund wäre, weil man die Ergebnisse anschaulicher darstellen kann. Die Frage ist nur mit welchen Verfahren erhält man eine standfeste, erklärbare Gruppierung.[/quote]
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11256
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2471 mal in 2455 Posts

Re: Cluster alternative zum MedianSplit?

Beitragvon Mireille » Fr 7. Aug 2015, 18:22

Hallo alle,

Vielleicht interessiert es ja noch jemanden, ob eine Clusteranalyse besser ist als ein Mediansplit. Das wurde ja leider nicht beantwortet.
Ein wichtiger Punkt ist dabei, dass wenn die Items zu stark miteinander korrelieren, es nicht sinnvoll ist, eine CA zu rechnen.

van Dongen, S. und Enright, A. J. (2012). Metric distancesderived from cosine similiarity and pearson and spearman correlations.

Wenn wir aber nur eine Variable haben, ist es auch nicht sinnvoll, eine CA zu rechnen.

Die CA bringt nur dann einen Mehrwert, wenn die Items nicht miteinander korrelieren und man tatsächlich auf der Suche nach Klassenzugehörigkeiten ist, wie etwa Menge an Bierkonsum und Verlust der Hörstärke als ein mögliches Cluster "Clubbesucher".

Bitte keine unhöflichen (soetwas wie wtf als Grußformel) oder offensiven Reaktionen (z.B. Vorwürfe, man hätte einen grundlegenden Denkfehler gemacht). Danke.

Grüße,
Mireille
Mireille
Beobachter
Beobachter
 
Beiträge: 16
Registriert: Fr 15. Mai 2015, 19:28
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Cluster alternative zum MedianSplit?

Beitragvon strukturmarionette » Sa 8. Aug 2015, 03:54

Hi,

ob eine Clusteranalyse besser ist als ein Mediansplit. Das wurde ja leider nicht beantwortet.

Züruck zur Frage nach dem Zusammenhang zwischen AV und UV


- es besteht die möglichkeit, die vier (offensichtlich intervallskalierten) AVs zu clustern oder faktoranalytisch zu untersuchen
- beides sind Ausprobierverfahren(!)
- bei deinen vier AVs eröffnet sich aufgrund der sehr vielfältigen und flexiblen Möglichkeiten bei den Berechnungsprocederes von Clusteranalysen grundsätzlich die Möglichkeit, solange zu clustern, bis sich eine gewünschte Aufteilung der Gesamtstichprobe ergibt. Du müsstest also vorher möglichst einen Sinn und Zweck definieren.
- die Frage nach besser oder schlechter kann somit an dieser Stelle nicht oder kaum beantwortet werden
- FA eignet sich m.E. nicht dazu, ein Stichprobe in Teilstichproben aufzueilen
- sinnvolle Ergebnisinterpretation können nur aus theoretischen fachlichen Erwägungen heraus vorgenommen werden
- ein Alternative zum Mediansplit der UV sind beide Verfahren nicht
- wenn zusätzlich zu deiner UV und den vier AVs noch weitere Variablen in Deinem Rohdatenbestand existieren, gäbe es noch weitere Möglichkeiten

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4313
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 582 mal in 579 Posts


Zurück zu Clusteranalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron