Verteilung Endogene Indikatoren

Verteilung Endogene Indikatoren

Beitragvon Data » So 16. Sep 2012, 12:41

Hallo,

Beispielsweise bei Kline (2011, Seite 63 ff.) werden die Möglichkeiten skizziert, durch mathematische Verfahren, Intervallskalendaten derart umzuwandeln, dass aus nichtnormalverteilten Variablen (Extreme Schiefe oder Kurtosis) Normalverteilte gemacht werden können.
(Quadrieren, logarithmieren, Box-Cox Transformationen)
Wenn ich meine Daten für ein SEM derart behandle, gelingt mir das auch.
Ich bin mir aber unsicher, warum das überhaupt zulässig ist.
Meine Analysen beziehen sich danach schließlich auf manipulierte Originaldaten.

Warum und wann ist das zulässig?

Vielen Dank
Data
Data
Mitglied
Mitglied
 
Beiträge: 24
Registriert: Do 31. Mai 2012, 22:30
Danke gegeben: 10
Danke bekommen: 1 mal in 1 Post

Re: Verteilung Endogene Indikatoren

Beitragvon Holgonaut » So 16. Sep 2012, 19:21

Hi,

ich hab es noch nie gesehen, dass das jemand in SEM vorschlägt. Hab das Kline-Buch irgendwo und muss mal schauen. Ich hab da auch kein gutes Gefühl bei.

Eine bessere Alternative ist die Satorra-Bentler-Korrektur bei nicht-normalverteilen Variablen. Die meisten Pakete haben das drin- z.B. lavaan in R.

Gruß
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

folgende User möchten sich bei Holgonaut bedanken:
Data

Re: Verteilung Endogene Indikatoren

Beitragvon Data » So 16. Sep 2012, 20:38

Hallo nochmal,

vielen Dank für den Hinweis auf die Möglichkeit von Satorra-Benter-Korrekturen bei nicht-normalverteilten Daten.

_
Das ist konkret das Buch (Seite 63 ff.), auf das ich mich wegen der Transformationen bezog.

Kline, R.B. (2011).
Principles and Practice of Structural Equation Modeling. Dritte Auflage. New York, London: Guilford Press.


Aber auch beispielsweise bei:

_
Tabachnick, B. G. & Fidell, L. S. (2007).
Using multivariate statistics, Fifth Edition, Boston: Pearson Education.

finden sich (nicht mit direktem Bezug zu SEM) Kurzanleitungen zu Transformationen, um NV-Daten zu erzeugen.

_
Zwar wird meist auf potenielle allgemeine Missverständnisse hingewiesen, die entstehen können. Dass die Vorgehensweise bei einer Interpretation beachtet und genannt wird, dass die Ranfgfolge der Messwerte erhalten bleibt und sich der Median der Daten nicht ändert u.s.w.)

_
Ich selber habe Ergebnisse aus etlichen Rating-Skalen mit mal links-, mal rechtsschiefen Verteilungen, die teils Adaptionen aus dem Englischen sind und teils standardisierte deutsche Messinstrumente.

Ein Zulässigkeit von NV-Transformationen im SEM hierbei kann ich kaum beurteilen.
Meine Frage wäre: Das Wann und Warum? Insbesondere beim Messmodell der Endogenen Indikatoren im SEM.

Viele Grüße
Data
Data
Mitglied
Mitglied
 
Beiträge: 24
Registriert: Do 31. Mai 2012, 22:30
Danke gegeben: 10
Danke bekommen: 1 mal in 1 Post

Re: Verteilung Endogene Indikatoren

Beitragvon Holgonaut » Mo 17. Sep 2012, 11:22

Hi,


Meine Frage wäre: Das Wann und Warum?


SEM setzt voraus, dass die Daten nicht nur univariat normalverteilt sind, sondern multivariat normal. Das ist NIE der Fall.
Je nach Ausmaß der Abweichung werden der Chi-Quadrat-Wert nach oben verzerrt und die Standardfehler nach unten.

Klar kann man das durch Transformationen beheben. Die Satorra-Bentler-Korrektur ist meines Wissens sinnvoller.

Chou, C.-P., & Bentler, P. M. (1995). Estimates and tests in structural equation modeling. In R. H. Hoyle (Ed.), Structural equation modeling - concepts, issues, and applications (pp. 37-55). Thousand Oaks: Sage.

Chou, C.-P., Bentler, P. M., & Satorra, A. (1991). Scaled test statistics and robust standard errors for non-normal data in covariance structure analysis: A monte-carlo-study. British Journal of Mathematical and Statistical Psychology, 44, 347-357.

Curran, P. J., West, S. G., & Finch, J. F. (1996). The robustness of test statistics to nonnormality and specification error in confirmatory factor analysis. Psychological Methods, 1(1), 16-29.

West, S. G., Finch, J. F., & Curran, P. J. (1995). Structural equation models with nonnormal variables: Problems and remedies. In R. H. Hoyle (Ed.), Structural equation modeling - concepts, issues, and applications (pp. 56-75). Thousand Oaks: Sage.


Gruß
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

folgende User möchten sich bei Holgonaut bedanken:
Data

Re: Verteilung Endogene Indikatoren

Beitragvon AmosOz » So 18. Nov 2012, 16:38

Hallo zusammen,

ich habe ein ähnliches Problem:

Meine Stichprobe besteht aus 157 Probanden. Die Daten wurden über siebenstufige Likert-Zustimmungsskalen erhoben. Es sind 21 Items,die auf 4 Faktoren laden + eine manifeste Variable.

Das assesment of normality gibt mir die kurtosis mit ca. 188 und c.r. mit rund 36 an. Die Werte werden etwas besser, je nachdem, wie viele "Ausreißer" ich entferne. Doch selbst wenn ich ein Drittel rausnehme, bin ich immer noch weit weg von einem c.r.-Wert von 2,57.

Was kann ich jetzt tun, um dennoch ein vernünftig interpretierbares und valides Ergebnis zu bekommen?

West/Finch/Curran 1995 schlagen dazu Einiges vor, aber so ganz schlau werde ich daraus als Statistik-Laie nicht.

ADF: Scheidet aus, da n zu klein.

Scaled chi^2: Amos bietet keine Möglichkeit zur Satorra-Bentler-Korrektur und um mich noch in irgendein anderes Programm einzuarbeiten fehlt mir leider die Zeit ...

Bootstrapping: Laut der Amos-Website gleichwertig mit der Satorra-Bentler-Korrektur. Was muss ich hierbei beachten? Kann ich alle Werte danach normal interpretieren? Wo finde ich hierzu eine gute Anleitung?

Transformation: Wenn ich die Items mit einer Schiefe über 1 logarithmiere und die mit negativer Schiefe quadriere wird es insgesamt kein bisschen besser :(

Item Parcels: Ist das dass hier? http://www.youtube.com/watch?v=dsOS9tQjxW8 Wenn ja und falls ich das richtig gemacht habe, dann wäre ich froh, denn dann wären die Werte schon viel besser (kutosis: 5,5; c.r. 4,1). Aber auch noch lange nicht gut. Meine manifeste Variable (kann nur 1 oder 2 annehmen) haut hier ziemlich rein.

Hat jemand noch eine Idee für mich, wie ich mit diesen extremen Werten umgehen? Kann ich statt ML nicht einfach GLS oder ULS verwenden oder statt Amos SmartPLS nutzen, da es beim varianzanayltischen Vorgehen weniger Restriktionen gibt.

Herzlichen Dank für Eure Hilfe und Ideen!
AmosOz
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 18. Nov 2012, 16:03
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Verteilung Endogene Indikatoren

Beitragvon Holgonaut » Mo 19. Nov 2012, 11:57

Hi

Es sind 21 Items,die auf 4 Faktoren laden + eine manifeste Variable


Das heißt, 7 items laden auf je einem Faktor. Das wird wohl nicht funktionieren. Aber das sehen wir dann ;)

Den Test bekommst du nie multivariat normal. Fälle zu eliminieren ist nicht so sinnvoll und reduziert Deine sowieso
zu kleine Stichprobe noch mehr....
Satorra-Bentler ist die beste Lösung (investier doch einen Tag mal in lavaan (www.lavaan.org) - das ist nicht schwer).

Ansonsten ist bootstrapping sicher auch geeignet. Wie das geht, müsstest allerdings selbst herausfinden.

Item-parcels setzen voraus, dass alle items, die in die parcels gehen, kausal eindimensional sind (d.h. den selben Faktor messen). Das
muss man nachweisen. Lass es daher besser.

ULS wäre tatsächlich u.U. eine Alternative. Damit kenn ich mich allerdings zu wenig aus...PLS würde ich nicht benutzen. Eine Variable
in einem PLS - Modell ist ein composite und keine latente Variable. Außerdem kannst du den größten Quatsch machen und du hast keine
Möglichkeit, das rauszubekommen, weil es keinen Fit gibt.


Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

folgende User möchten sich bei Holgonaut bedanken:
AmosOz

Re: Verteilung Endogene Indikatoren

Beitragvon AmosOz » Di 20. Nov 2012, 21:05

Hi Holger,

vielen Dank für die Antwort! Bootstrapping, ML und ULS liefern vergleichbare Ergebnisse. Das spricht denke ich für das Modell.
Wenn ich mal mehr Zeit habe schau ich mir auch mal Lavaan an.

Grüße
AmosOz
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 18. Nov 2012, 16:03
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Verteilung Endogene Indikatoren

Beitragvon Albrecht » Sa 12. Apr 2014, 16:40

Ist eigentlich Satorra-Bentler auch bei extrem schiefen Daten geeignet? Ich meine solche Items, bei denen die Null (also das eine Extrem der Skala) durchweg den Modalwert abbildet.

Oder würde es sich da eher empfehlen mit polychorischen Korrelationen als Input-Daten zu arbeiten und mit ULS oder DWLS. Die vorhandenen Stichprobe ist >1500 Fälle? Skaleninvarianz wäre kein Problem, da alle Indikatoren das gleiche Format aufweisen.

Persönlich hätte ich mit Boot-Strapping gearbeitet, weil das bei AMOS relativ praktisch intergriert ist. Allerdings habe ich nicht über die extrem-schief verteilten Items nachgedacht.
Albrecht
Veteran
Veteran
 
Beiträge: 273
Registriert: Di 26. Nov 2013, 13:04
Danke gegeben: 32
Danke bekommen: 54 mal in 54 Posts

Re: Verteilung Endogene Indikatoren

Beitragvon Holgonaut » So 13. Apr 2014, 09:07

Hi Albrecht,

der Aspekt polychorische Korrelationen / DWLS betrifft die ordinale Natur von items - nicht deren Verteilung. Auch DWLS setzt eine normalverteilte response-Variable voraus und wäre daher m.E. nicht geeignet.

Schau dir dazu mal
Rhemtulla, Mijke, Brosseau-Liard, Patricia, & Savalei, Victoria. (2012). When can categorical variables be treated as continuous? A comparison of robust continuous and categorical SEM estimation methods under suboptimal conditions. Psychological Methods, 17(3), 354-373.

an.

Darüberhinaus: Wenn items so krass schief sind, stellt sich bei mir die Frage nach dem Grund. Das klingt schon fast nach einer Poisson-verteilten Variable, wo Nullen sehr häufig sind, oder nach einer mixture aus zwei verschieden Gruppen (die eine sagt grundsätzlich "0", weil das item unzutreffend ist und die andere ist normalverteilt).

Leider kann lavaan mixture modeling (noch?) nicht. Aber es gibt ja auch univariate latent profile - Ansätze, mit denen man beide Gruppe vielleicht trennen könnte. Oder man nimmt Mplus ;)

Gruß
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

folgende User möchten sich bei Holgonaut bedanken:
Albrecht

Re: Verteilung Endogene Indikatoren

Beitragvon Albrecht » Fr 18. Apr 2014, 22:08

Holgonaut hat geschrieben:Hi Albrecht,

der Aspekt polychorische Korrelationen / DWLS betrifft die ordinale Natur von items - nicht deren Verteilung. Auch DWLS setzt eine normalverteilte response-Variable voraus und wäre daher m.E. nicht geeignet.

Schau dir dazu mal
Rhemtulla, Mijke, Brosseau-Liard, Patricia, & Savalei, Victoria. (2012). When can categorical variables be treated as continuous? A comparison of robust continuous and categorical SEM estimation methods under suboptimal conditions. Psychological Methods, 17(3), 354-373.

Okay, Danke für den Tipp. Ich hatte ein Paper gelesen, indem die polychorischen Korrelationen genommen wurden bei meinen Items und dazu dann die ULS-Schätzung.
Holgonaut hat geschrieben:Darüberhinaus: Wenn items so krass schief sind, stellt sich bei mir die Frage nach dem Grund. Das klingt schon fast nach einer Poisson-verteilten Variable, wo Nullen sehr häufig sind, oder nach einer mixture aus zwei verschieden Gruppen (die eine sagt grundsätzlich "0", weil das item unzutreffend ist und die andere ist normalverteilt).

Also von Poisson verteilten Variablen habe ich bisher nur im Ansatz gehört.
Die Items sind krass schief verteilt, weil kriminelle Verhaltensweisen in der Normalbevölkerung erfasst wurden. Diese kommen dann naturgemäß selten vor.
Das sind aber ansonsten Standarditems.

Und nein, wozu MPLUS? Ich favorisiere AMOS ;)
R wäre noch das höchste der Gefühle, wobei ich mich dort dann auch noch einarbeiten müsste.
Albrecht
Veteran
Veteran
 
Beiträge: 273
Registriert: Di 26. Nov 2013, 13:04
Danke gegeben: 32
Danke bekommen: 54 mal in 54 Posts

Nächste

Zurück zu Pfadanalyse, Strukturgleichungsmodelle & CFA

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast