STATISTIK-FORUM.de

Jules.hammerhand · von **Jules.hammerhand** » Fr 19. Mai 2017, 13:20

Hallo liebe Community,
nachdem ich eine Weile schon als stiller Leser unterwegs war, habe ich nun ein eigenes Anliegen.

Ich bin momentan in der Start Phase meiner Bachelorthesis. Innerhalb der Bachelor Thesis möchte ich Geschäftsmodelle im Bereich Big Data analysieren.
Dazu würde ich gerne eine Cluster Analyse mit geeignetem Algorythmus durchführen, um eventuelle Gruppen innerhalb des Big Data Marktes auszumachen.

Die Stichprobengröße beträgt hier ~n=150 Unternehmen.
Analysiert werden 4 verschiedene Variablen. Data Sources/Key activity/Offering/Target customer.
Diese können mehrere ausschließlich nominale Ausprägungen annehmen, welche teilweise noch in Ausprägungen einer weiteren Stufe untergliedert sind.

Bsp. 1.Datenquelle: 1.1Interne Daten : 1.1.1 existierende Daten / 1.1.2 generierte Daten
1.2 externe Daten : 1.2.1 Kundendaten
1.2.2freie Daten : 1.2.2.1Open data/ 1.2.2.2 social media data/ 1.2.2.3 Web crawled Data

Meine Frage wäre nun, welche Cluster Analyse für solch ein Vorhaben geeignet wäre?
In einer ähnlichen Studie, konnte ich bereits eine Cluster Analyse finden, welche den K-medoids Algorythmus und das Euklidische Distanzmaß nutzt.

Soweit ich mich an meine Statistik Vorlesungen erinnern kann, gibt es hier die Möglichkeiten einmal eben über mehrstufige nominale Daten zu arbeiten, oder die Daten binär zu codieren?

Wie ihr seht bin ich wirklich nicht sehr belesen was dieses Thema angeht, ich hoffe ihr könnt mir weiterhelfen.
Danke schon einmal im Vorraus.

Gruß Julian

STATISTIK-FORUM.de

Cluster Analyse nominale mehrstufige Daten

Cluster Analyse nominale mehrstufige Daten

Wer ist online?