Clusteranalyse für Paneldaten in R

Alles rund um Clusteranalysen.

Clusteranalyse für Paneldaten in R

Beitragvon mango » Fr 1. Jul 2016, 09:18

Hallo zusammen,

gibt es ein Verfahren, mit dem sich auf Basis von Paneldaten Individuen clustern lassen?

Ich habe Paneldaten mit gemischten Variablentypen (ordinale Variablen sowie einige intervallskalierte) und möchte gerne eine Clusteranalyse in R laufen lassen. Dafür würde ich das Gower-Entfernungsmaß nutzen und die Ergebnisse dann mit der Funktion pam() aus dem Paket cluster clustern wie hier beschrieben: http://stackoverflow.com/questions/3122 ... tance-in-r

Die Schwierigkeit ist jetzt, die Panelstruktur irgendwie zu berücksichtigen. Die pragmatische Variante wäre natürlich, sich einfach das arithmetische Mittel plus evtl. noch ein Maß für die intraindividuelle Schwankung der Variablen berechnen zu lassen und damit Querschnittdaten zu generieren. Das ist aber einerseits keine gute Lösung für die ordinalen Daten. Ich könnte hier natürlich den Median oder den Modalwert verwenden aber würde damit eine Menge Informationen verlieren. Andererseits stecken in den Paneldaten so oder so zusätzliche Informationen, die mit einfachen aggregierten Werten nur unzureichend wiedergegeben sind. Bestimmte Messzeitpunkte spielen für mich keine Rolle, eher die personenspezifische Charakteristik der zeitabhängigen Schwankungen.

Beide Vorbehalte sprechen dafür, die Panelstruktur beizubehalten und nach einem Verfahren zu suchen, dass mir die Daten in dieser Form auf Individuenebene clustern kann. Aber gibt es sowas überhaupt?
mango
Elite
Elite
 
Beiträge: 330
Registriert: Fr 2. Mai 2014, 16:55
Danke gegeben: 3
Danke bekommen: 55 mal in 55 Posts

Re: Clusteranalyse für Paneldaten in R

Beitragvon Institut_Zwei » Fr 1. Jul 2016, 10:23

gibt es ein Verfahren, mit dem sich auf Basis von Paneldaten Individuen clustern lassen?
Ja, man kann auch mit Paneldaten arbeiten, hab' ich zumindest

Panelstruktur irgendwie zu berücksichtigen
- hängt von der Struktur ab :)
--
Kurzer
Google: Statistikinstitut Zwei
Institut_Zwei
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Mo 27. Jun 2016, 21:14
Wohnort: Osnabrück
Danke gegeben: 0
Danke bekommen: 3 mal in 3 Posts

Re: Clusteranalyse für Paneldaten in R

Beitragvon mango » Fr 1. Jul 2016, 11:39

Hallo,

was fehlen denn Informationen über die Struktur? Es geht um individuenspezifische (genauer: haushaltsspezifische) Daten zu Produktkäufen. Als Zeitvariable gibt es nur die Zeit seit dem letzten Kauf, d. h. die Beobachtungen sind innerhalb eines Haushalts ungeordnet. Es gibt eine Reihe zeitveränderliche binäre, ordinale sowie kontinuierliche Variablen und auch ein paar kontinuierliche zeitkonstante Variablen.

Was wäre denn ein gutes Verfahren für so eine Problemstellung? Gerne direkt mit Literaturverweis, dann kann ich mich reinlesen. Mir fehlt nur das entsprechende Stichwort und meine eigene Literatur gibt zur Kombination Mehrebenendaten und Clusteranalyse leider nichts her.
mango
Elite
Elite
 
Beiträge: 330
Registriert: Fr 2. Mai 2014, 16:55
Danke gegeben: 3
Danke bekommen: 55 mal in 55 Posts


Zurück zu Clusteranalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste