Seite 1 von 1

Handhabung der Ausgeschlossenen Datensätze

BeitragVerfasst: Mo 28. Mär 2022, 04:41
von MonMich
Kurze Frage dazu, wie ich dann im weiteren Verfahren mit den Aussortierten Datensätzen um gehe. Ich habe bei mir die cluster soweit gebildet, auch mit einigen ausgeschlossenen Datensätzen.
Wenn ich jetzt Korrelationen zwischen einer Variable betrachten möchte, welche von allen teilnehmern (also auch die aus der cluster augeschlossenen) Datensätze hat, muss ich dann auch die Datensätze der Ausgeschlossenen auch bei der Einflussvariable ausschließen?

Re: Handhabung der Ausgeschlossenen Datensätze

BeitragVerfasst: Mo 28. Mär 2022, 07:48
von bele
Ob man in der einen Rechnung Fälle einschließt, die in einer anderen Rechnung, beispielsweise wegen fehlender Daten, ausgeschlossen wurden, dafür gibt es keine einheitliche Regel. Wenn es zwei sehr ähnliche Rechnungen sind, die nachher miteinander in Beziehung gesetzt werden sollen, dann kann es Sinn machen, möglichst gleiche Datensätze zu haben. Wenn es um zwei ganz verschiedene Sachen geht, die nicht direkt miteinander in Beziehung stehen, dann kann es mehr Sinn machen, möglichst alle vorhandenen Daten auszunutzen. Vor allem bei sehr vielen Variablen kann Imputation eine Alternative zum Fallausschluss sein.

Re: Handhabung der Ausgeschlossenen Datensätze

BeitragVerfasst: Mo 28. Mär 2022, 08:45
von strukturmarionette
Hi,

Ich habe bei mir die cluster soweit gebildet

- mit welchem /welchen Clusteranalyseverfahren?
- N?

Gruß
S.

Re: Handhabung der Ausgeschlossenen Datensätze

BeitragVerfasst: Mo 28. Mär 2022, 15:42
von MonMich
strukturmarionette hat geschrieben:Hi,

Ich habe bei mir die cluster soweit gebildet

- mit welchem /welchen Clusteranalyseverfahren?
- N?

Gruß
S.


Clusterverfahren war das ward verfahren und N dafür waren 206 davor und 7 davon wurden für die cluster ausgeschlossen