Variablen Generierung

Variablen Generierung

Beitragvon Maureen89 » Di 22. Jan 2013, 21:35

Hallo zusammen,

ich wäre euch sehr dankbar, wenn ihr mir bei folgender Fragestellung weiterhelfen könntet:

Zur Reduzierung der Datenkomplexität habe ich mit Hilfe einer Hauptkomponentenanalyse meine 9 Items auf 3 Faktoren reduzieren können und möchte jetzt mit diesen Faktoren weiterarbeiten. Leider ist mir nicht ganz klar, wie ich die neuen Variablen generieren muss. Persönlich war ich der Meinung, dass ich jedes Item dem Faktor zuordne, auf den das Item am höchsten lädt - sprich jedes Item wird genau einem Faktor zugeordnet und jeder Faktor generiert sich dann als die Summe der ihm zugeordneten Items durch deren Anzahl. Bspw.: Faktor1 = (Item1 + Item3 + Item9)/3
Als Alternative ist jetzt allerdings noch aufgekommen, dass man jedes Item jedem Faktor mit seiner jeweiligen Faktorladung gewichtet aufsummiert.
Leider wird mir trotz Literaturrecherche nicht klar, wie man verfahren soll bzw. ob überhaupt eine der beiden genannten Ansätze richtig ist. Letztere Fragestellung kommt insbesondere dann auf, wenn ich nach meiner Faktoranalyse (ich benutze Stata) mit dem Befehl "predict" die einzelnen Faktorwerte bestimmen lasse und dann zum Teil sogar negative Werte bekomme obwohl alle Items eigentlich von 1-7 skaliert sind???
Vielleicht sollte ich noch anführen, dass mir deshalb eine händische Generierung wichtig ist, weil besagte Items zu zwei verschiedenen Zeitpunkten erhoben wurden und nach dem gleichen Muster den Faktoren (die nur aus den Messungen der Werte aus T1 generiert wurden) zugeordnet werden sollen.

Bin für jede Hilfestellung dankbar...

Liebe Grüße
Maureen
Maureen89
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 22. Jan 2013, 21:31
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Variablen Generierung

Beitragvon Holgonaut » Mi 23. Jan 2013, 00:05

Hi,

da es lediglich darum geht, items zu Komponenten (nicht "Faktoren") zu reduzieren, ist es völlig schnuppe, was du machst. Einen Haufen von Stiften in rote und blaue zu sortieren ist genauso "richtig" wie in Kullis und Bleistifte.

Daneben korrelieren ungewichtete und gewichtete Summen in der Regel um die .90.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Variablen Generierung

Beitragvon Maureen89 » Mi 23. Jan 2013, 00:23

Hallo Holger,

danke für deine antwort!

Vielleicht habe ich mich falsch ausgededrückt: Es handelt sich um eine Faktorenanalyse nach der Principal Component Factor Methode. Eine statistisch belegbare (sinnvolle) Zusammenfassung / Zuordnung der einzelnen Items auf möglichst wenige neue Variablen bzw. Faktoren ist der einzige Grund, warum ich diese Analyse überhaupt mache?! Ich habe ja auch wie gesagt die Faktorladungen der einzelnen Items auf die 3, sich in meinem Fall ergebenden, Faktoren - mir ist nur nicht klar, wie ich daraus jetzt die 3 neuen Variablen zu bestimmen habe, die die Informationen aus alle 9 Items, heruntergebrochen auf die 3 errechneten Faktoren, enthalten.

Wär super, wenn du mir nochmal einen Tipp geben könntest

Liebe Grüße
Maureen
Maureen89
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 22. Jan 2013, 21:31
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Variablen Generierung

Beitragvon Holgonaut » Mi 23. Jan 2013, 00:35

Hi Maureen,

Es handelt sich um eine Faktorenanalyse nach der Principal Component Factor Methode


Den Begriff hab ich noch nie gelesen. Eine Faktorenanalyse modelliert das "common factor model" - demnach hat der Begriff "Faktor" eine sehr genaue und spezifische
Bedeutung, nämlich als gemeinsame Ursache der multiplen Indikatoren. Ergo setzt sich die Varianz jedes Indikatoren aus Fehler- und Faktor-bedingter Varianz zusammen.
Das Komponentenmodell unterscheidet nicht zwischen diesen beiden Varianz-Gründen. Eine Komponente ist ein gewichteter Summenwert - der sich *aus den items* (eben durch die
Summierung ergibt. Also: Faktor ---> item vs. item ---> Komponente.

Siehe

Fabrigar, L. R., Wegener, D. T., MacCallum, R. C., & Strahan, E. J. (1999). Evaluating the use of exploratory factor analysis in psychological research. Psychological Methods, 4(3), 272-299.

Russel, D. W. (2002). In search for underlying dimensions - The use (and abuse) of factor analysis in Personality and Social Psychology Bulletin. Personality and Social Psychology Bulletin, 28(2), 1629-1646.

Costello, A. B., & Osborne, J. W. (2005). Best practices in exploratory factor analysis: Four recommendations for getting the most from your analysis. Practical Assessment and Evaluation, 10(7), 1-9.
http://pareonline.net/pdf/v10n7.pdf

Conway, J. M., & Huffcutt, A. I. (2003). A review and evaluation of exploratory factor analysis practices in organizational research. Organizational Research Methods, 6(2), 147-168.

Eine statistisch belegbare (sinnvolle) Zusammenfassung / Zuordnung der einzelnen Items auf möglichst wenige neue Variablen bzw. Faktoren ist der einzige Grund, warum ich diese Analyse überhaupt mache?!


Der Sinn der Hauptkomponentenanalyse ist es, korrelierende items durch eine Komponente zu ersetzen, weil Korrelation eine informationstheoretische Redundanz implizieren. Das ist aber nicht "richtig" oder "falsch". Genauso könntest du inhaltliche/theoretische Bewegungründe wählen, um items zu einem Index zu summieren. Alle wichtigen Indizes - z.B. wirtschaftliche Indizes basieren auf theoretischen Erwägungen.

Und wegen des Tipps: Das hatte ich doch schon gesagt: Summiere/mittle sie und fertig ist der Lack :)

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

folgende User möchten sich bei Holgonaut bedanken:
Maureen89

Re: Variablen Generierung

Beitragvon Maureen89 » Mi 23. Jan 2013, 01:05

Lieber Holger,

danke für deine nochmal so ausführliche Antwort.
Leider ist mein statistisches Verständnis relativ beschränkt und ich möchte auch nicht in Frage stellen, was du geschrieben hast - nur wird mein Betreuer glaube ich nicht so begeistert sein, wenn ich die Variablen mehr oder minder willkürlich bestimme. Aber auch nur um das nochmal für mich zu erfassen: Den einen richtigen Weg gibt es nicht?!
Wenn dem jetzt so ist, hast du ja vorgeschlagen die items zu summieren - wie hast du das gemeint: (1) so wie ich oben geschrieben habe, dass jedes Item dem Faktor zugeordnet wird auf den die höchste Faktorladung ausgewiesen ist oder (2) alle Items auf alle Faktoren mit ihrer Faktorladung als Gewichtung aufsummiert (s.o.).? Bzw. falls es egal ist: wie wäre es üblich, das zu machen??

Ergänzend vielleicht auch einfach nochmal - falls es dich interessiert - eine Erklärung zur Principal Component Factors Methode aus der Stata Hilfedatei:
"pcf specifies that the principal-component factor method be used to analyze the correlation matrix. The communalities are assumed to be 1."
Die Faktoranalyse wird in Stata also mit pcf als ergänzendem Befehl ausgeführt (standardmäßig würde er sonst die principal factor methode anwenden).

Liebe Grüße
Maureen
Maureen89
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 22. Jan 2013, 21:31
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Variablen Generierung

Beitragvon Holgonaut » Mi 23. Jan 2013, 11:33

Hi,

um das nochmal für mich zu erfassen: Den einen richtigen Weg gibt es nicht?!


Ein richtiger Weg würde implizieren, dass es das Modell eine eine existierende Struktur repräsentiert. Wie schon gesagt, ist der Index eine Folge des Zusammenaddierens aufgrund der Interkorrelation. So ein Index hat außerhalb dieses Prozesses des Zusammenaddierens keine eigenständige Realität. Beim common factor model im Gegensatz ist das anders: Hier besteht die Hypothese, dass es eine unbeobachtete Entität gibt, die für die Interkorrelationen der items verantwortlich ist. Das kann falsch sein, wenn diese Entität gar nicht existiert, oder das Modell falsch ist. Ein differenzierendes Merkmal beider Modelle ist auch, dass sich der Index verändert, wenn du die items änderst (einige raus, andere rein). Der Faktor kann sich im Gegensatz nicht durch die Auswahl der items ändern. So ändert sich z.B. mein Körpergewicht nicht, wenn ich eine andere Waage benutze. Das Stata diese beiden Begriffe vermischt ist sehr unschön. Das was du beschreibst (mit den Kommunalitäten =1) ist das Komponentenmodell. Es ist aber nicht unüblich, dass beide Begriffe vermischt werden. Die Psychologen vermischen sie seit Beginn der Forschung...

Aber bleib ruhig bei Deinem Vorgehen mit der Hauptkomponentenanalyse. Und es ist üblich, die items zu addieren. Du kannst sie wie gesagt, gewichten oder "Factorscores" berechnen (was dem entspricht). Das Ergebnis wird sich nicht stark unterscheiden.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Variablen Generierung

Beitragvon PonderStibbons » Mi 23. Jan 2013, 11:38

Gewichte sind stichprobenabhängig und die gewichtet gebildeten Skalen sind
schwer bis gar nicht replizierbar, insofern wäre eine ungewichtete Addition
vorzuziehen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11258
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2473 mal in 2457 Posts

Re: Variablen Generierung

Beitragvon Maureen89 » Do 24. Jan 2013, 22:50

Hi,

danke euch beiden für eure Antworten.

Vielleicht nochmal eine allerletzte Frage: hat jmd von euch zufällig eine Idee, was der Befehl predict in Stata genau macht bzw. wie er das macht?
Also ich weiß, dass er für jeden Faktor eine neue Variable macht, in der die "Scores des Faktors" stehen (=Faktorwerte?!). Was ich nicht verstehe ist warum einige dieser Werte negativ werden und andere nicht (in die Hauptkomponentenanalyse sind ja jeweils nur positive Beobachtungen eingegangen, siehe auch meinen 1. Post).
Außerdem, bezogen auf meine ursprüngliche Fragestellung, würde mich interessieren, ob ihr der Meinung seid, dass ich mit diesen Variablen weiterarbeiten kann bzw. ob da irgendetwas dagegen spricht.

Für eure Hilfe schonmal vielen vielen Dank!

Liebe Grüße
Maureen
Maureen89
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 22. Jan 2013, 21:31
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Faktorenanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron