Faktorenanalyse ohne normalverteilte Daten

Faktorenanalyse ohne normalverteilte Daten

Beitragvon Jörg » Di 12. Mär 2019, 17:27

Hallo zusammen,

Für meine Abschlussarbeit möchte ich gerne eine Faktorenanalyse über die Daten laufen lassen, die ich mit einem selbst erstellten Fragebogen (ca. 50 Items) erhoben habe. Meine Stichprobe umfasst nach aktuellem Stand etwas mehr als 90 Datensätze.

Alle Items im Fragebogen beziehen sich auf die Häufigkeit von bestimmten Aktivitäten und sind likert-skaliert (Nie- sehr selten - eher selten - eher oft - sehr oft - immer) d.h. ansatzweise "metrisch" (oder zumindest ordinalskaliert). Nach einem ersten kurzen Blick in die Daten ist recht deutlich erkennbar, dass die Häufigkeitsverteilungen der Antworten für die Items keinen Normalverteilungen folgen d.h. meines Wissens nach mindestens eine "Grundvoraussetzung" für z.B. eine explorative Faktorenanalyse nicht erfüllt ist.

Hier ein Beispiel für die typische Häufigkeitsverteilung der Antworten für ein Item (n>90):
Nie - ca. 60%
Sehr selten - < 5%
Eher selten - etwa 10%
Eher oft - etwa 15 %
Sehr oft - etwa 10 %
Immer - <5%

Die Häufigkeitsverteilungen der Antworten ("Sehr selten" bis "Immer") folgen also grundsätzlich schon ungefähr einer symmetrischen "Normalverteilung", haben aber jeweils eine sehr starke Spitze über der Antwortmöglichkeit "Nie", sind also insgesamt in diesem Sinne stark "linkssteil" (bzw. eigentlich sogar eher s-förmig in Richtung eines Polynoms dritten Grades).

Mir ist nun noch nicht ganz klar, wie ich damit umgehen soll, um trotzdem eine (explorative) Faktorenanalyse rechnen zu können und würde mich gerne in entsprechende Literatur einlesen.

Hier meine Fragen dazu, damit ich etwas gezielter recherchieren kann:

1) Ist es sinnvoll, die Daten vor der Faktorenanalyse zu transformieren, sodass sie eher einer Normalverteilung folgen? Welche Transformationen könnten hier hilfreich sein?

2) Gibt es so etwas wie eine "nicht-parametrische" Faktorenanalyse d.h. ein Verfahren, das einer explorativen Faktorenanalyse sehr ähnlich ist, aber keine normalverteilten Daten voraussetzt?

3) Habt ihr Literaturtipps zu den Fragen 1 und 2?


Das wars von meiner Seite. Vielen Dank für eure Hilfe!!

Beste Grüße,
Jörg
Jörg
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Di 12. Mär 2019, 16:56
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Faktorenanalyse ohne normalverteilte Daten

Beitragvon bele » Di 12. Mär 2019, 17:56

Hallo Jörg,

ich habe viel zu wenig Ahnung von Faktorenanalyse, um Dir eine konkludente Antwort zu geben. Mit dieser Vorrede darf ich drei Kommentare abgeben, die Du entsprechend vorsichtig behandelst:

1. 50 Items mit 90 Bögen zu untersuchen erscheint mir ein krasses Missverhältnis zu sein - kompetentere werden dazu mehr zu sagen haben.
2. Wie soll etwas, das nur 6 Stufen annehmen kann, jemals normalverteilt sein. Ich kann mir nicht vorstellen, dass diese ganzen psychologischen Tests alle an irgendwelche Normalverteilungen angelehnt beantwortet werden und doch steht in Einführungsbüchern in der Regel Hauptkomponenten und Faktorenanalysen drin. Ist wahrscheinlich üblich, da nicht so kleinlich zu sein.
3. "nicht-parametrische" Faktorenanalyse d.h. ein Verfahren, das einer explorativen Faktorenanalyse sehr ähnlich ist, aber keine normalverteilten Daten voraussetzt - Man kann Items mittels einer Clusteranalyse zusammenfassen. Vielleicht ist das ja ein Weg für Dich. Leseeinstieg: https://link.springer.com/content/pdf/1 ... 205389.pdf

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 3374
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 10
Danke bekommen: 690 mal in 680 Posts

folgende User möchten sich bei bele bedanken:
Jörg

Re: Faktorenanalyse ohne normalverteilte Daten

Beitragvon PonderStibbons » Di 12. Mär 2019, 18:25

Für meine Abschlussarbeit möchte ich gerne eine Faktorenanalyse über die Daten laufen lassen, die ich mit einem selbst erstellten Fragebogen (ca. 50 Items) erhoben habe. Meine Stichprobe umfasst nach aktuellem Stand etwas mehr als 90 Datensätze.

Du möchtest eine exploratorische (?) Faktorenanalyse über eine Matrix rechnen,
die aus 1225 Korrelationen zwischen den Items besteht, jede mit einem Standardfehler
berechnet, und das ganze auf Basis von 90 Probanden.

Das ist ambitioniert.

Ich kenne (bisher) keine noch so laxe Faustregel, die so ein Verhältnis Itemzahl/Probandenzahl
empfehlen würde. https://www.pareonline.net/pdf/v10n7.pdf

Alle Items im Fragebogen beziehen sich auf die Häufigkeit von bestimmten Aktivitäten und sind likert-skaliert (Nie- sehr selten - eher selten - eher oft - sehr oft - immer) d.h. ansatzweise "metrisch" (oder zumindest ordinalskaliert).

"ansatzweise metrisch" ist allerdings eine Aussage über Likert-Skalen (die aus mehreren
Items bestehen), nicht über das Antwortformat einzelner Likert-Items.
Nach einem ersten kurzen Blick in die Daten ist recht deutlich erkennbar, dass die Häufigkeitsverteilungen der Antworten für die Items keinen Normalverteilungen folgen d.h. meines Wissens nach mindestens eine "Grundvoraussetzung" für z.B. eine explorative Faktorenanalyse nicht erfüllt ist.

Wie bele bereits mitteilte, "Normalverteilung" war von vornherein ausgeschlossen.

Was die Erfordernis angeht, die gibt es in der Form für die input data meines Wissens nicht https://stats.stackexchange.com/questio ... ory-factor

Mit freundlichen Grüßen

PonderStibbons
"Multiple exclamation marks are a sure sign of a diseased mind." (Terry Pratchett, 'Eric').
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 7775
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 24
Danke bekommen: 1598 mal in 1585 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Jörg


Zurück zu Faktorenanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron