Seite 1 von 1

Skalenniveau

BeitragVerfasst: Do 12. Dez 2013, 16:15
von Wiegand
Hallo zusammen,

ich bin sowohl in diesem Forum als auch in der Statistikwelt neu. Deswegen hoffe ich in diesem Forum einige nützliche Informationen zu gewinnen.

Im Zuge meiner Abschlussarbeit werde ich mich mit der Clusteranalyse beschäftigen. Dabei habe ich folgendes Problem: Mir liegt eine Datenmatrix vor, in der die Spalten/Variablen Vorgänge sind, die an verschiedenen Objekten/Zeilen durchgeführt werden oder nicht. In den Zellen stehen die Zeitwerte der Vorgänge. Jedoch können viele der Vorgänge nur zwei Werte annehmen, wobei einer der Werte 0 ist (z.B. 20 sek und 0 sek). Denn entweder ist der Vorgang bei dem Objekt vorhanden oder nicht. In einigen Spalten können die Zellen aber auch drei oder vier verschiedene Werte annehmen. Da es sich um Zeitwerte handelt, würde ich nun davon ausgehen, dass es sich um metrisch skalierte Daten handelt. Aber kann man von metrisch skalierten Daten sprechen, wenn die Merkmale nur so wenige Ausprägungen annehmen können? Ein Mittelwert beispielsweise ist ja hier relativ schwer interpretierbar.

Vielen Dank für eure Hilfe
Gruß Wiegand

Re: Skalenniveau

BeitragVerfasst: Do 12. Dez 2013, 17:06
von Andiego
Hi Wiegand,

mal auf die schnelle:

Bei dichtomen Variablen (die haben 2 Ausprägungen) müsstest du Nähemaße berechnen. Bei metrischen Variablen Distanzmaße. Du erhältst also 2 Matrizen, die du hinterher über eine Gewichtung zusammen bringen musst. Nicht so einfach. Vielleicht entscheidest du dich wenn Möglich für dichotom oder metrisch.

Abstandsmaße bei ordinalen Daten (solche liegen dir vor) gehen eigentlich nicht, aber wenn es sein muss, dann schon. Sprech mal deinen Betreuer ab. Einige stellen sich da bestimmt quer. Andere winken es durch. Ich selbst wäre bei der Interpreation im Anschluss sehr vorsichtig und würde alle Fallstricke bei einem solchen Vorgang erwähnen.

Beste Grüße!

Re: Skalenniveau

BeitragVerfasst: Do 12. Dez 2013, 17:53
von Wiegand
Danke Andiego für deine schnelle Antwort.

Aber liegen mir denn tatsächlich dichotome oder ordinale Daten vor? Die Variablen haben in einigen Fällen zwar nur zwei Ausprägungen, aber trotzdem hat der Abstand zwischen zwei verschiedenen Ausprägungen ja eine gewisse Aussagekraft. Bei dichotomen Variablen, z.B. männlich/ weiblich macht ein Distanzmaß ja tatsächlich keinen Sinn. Aber hier würden sich zwei Objekte in einer Variablen z.B. um 20 sek unterscheiden (jenachdem ob der Vorgang vorhanden ist --> 20sek oder nicht --> 0 Sek). Bei ordinalen Daten hingegen könnte ja nur eine Rangfolge angegeben werden, ohne etwas über die Abstände zwischen den Ausprägungen sagen zu können. Da die Einheit hier aber sek ist, lässt der Abstand zwischen den Ausprägungen jedoch eine quantitative Aussage zu, z.B. bei Objekt A dauert ein Vorgang 15sek länger als bei Objekt B. Handelt es sich also nicht bei allen Variablen um metrische Größen, auch wenn die Ausprägungsvielfalt stark eingeschränkt ist?

VG Wiegand