Regressionsverfahren und Skalenniveau

Alle Verfahren der Regressionanalyse.

Regressionsverfahren und Skalenniveau

Beitragvon Midori » Mi 15. Jun 2011, 08:56

Hallo zusammen

Ich mache gerade die Auswertungen für meine Diplomarbeit. Nun bin ich mir nicht sicher, welches Regressions-Verfahren ich anwenden darf/soll.

Ich arbeite mit mehreren Textpassagen, bei denen verschiedene Merkmale kodiert wurden. Vorhersagen möchte ich jeweils den Prozentsatz an Personen, die auf eine Frage zum Text mit "ja" geantwortet haben. Die Prädiktoren sind die kodierten Merkmale.
Ein Prozentwert ist ja nun mind. intervallskaliert, oder? --> Kriterium = mind. intervall
Die kodierten Merkmale wurden gezählt aber auch gewichtet, weshalb sie nur ordinalskaliert sind (aber nicht z.B. 4 Stufen, sondern nach oben offen) --> Prädiktoren = ordinal

1. Frage: Gibt es ein Verfahren, das bei diesen Voraussetzungen eingesetzt werden darf?
2. Frage: Wie sollte da Verhältnis Anzahl Prädiktoren zu Anzahl Fälle etwa sein?

Dann möchte ich zwei verschiedene Gruppen vergleichen und schauen, ob die unterschiedlich auf die Merkmale reagieren, also ob die Kriterien ihre Antworten anders vorhersagen (wieder gleich mit Prozentwert und kodierten Merkmalen).

3. Frage: Wie kann ich überprüfen, ob die beiden Gruppen die kodierten Merkmale unterschiedlich nutzen oder nicht?

Freue mich auf eure Antworten!

Merci
Midori
Midori
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Mi 15. Jun 2011, 08:45
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: Regressionsverfahren und Skalenniveau

Beitragvon PonderStibbons » Mi 15. Jun 2011, 09:13

Ich arbeite mit mehreren Textpassagen, bei denen verschiedene Merkmale kodiert wurden. Vorhersagen möchte ich jeweils den Prozentsatz an Personen, die auf eine Frage zum Text mit "ja" geantwortet haben.

Das ist wirklich, was Du vorhersagen möchtest? Das übliche Ziel wäre, dass Du vorhersagen möchtest, ob eine einzelne Person eher mit mit ja Antwortet oder auch nicht.
In dem Fall multiple logistische Regression. Ausser Du hast zu wenig Fälle (siehe unten).
Die kodierten Merkmale wurden gezählt aber auch gewichtet, weshalb sie nur ordinalskaliert sind (aber nicht z.B. 4 Stufen, sondern nach oben offen) --> Prädiktoren = ordinal

Ordinale Prädiktoren musst Du in Dummy-Variablen umwandeln. Manche Statistikprogramme machen das automatisch, wenn man die ordinale Variable als "kategorial" angibt. Allerdings wird nicht ganz klar, wie viel Stufen denn Deine ordinalen Variablen haben und wie die konkret aussehen. Wenn es zu viele Stufen sind, kann es unpraktisch werden.
Dann möchte ich zwei verschiedene Gruppen vergleichen und schauen, ob die unterschiedlich auf die Merkmale reagieren, also ob die Kriterien ihre Antworten anders vorhersagen (wieder gleich mit Prozentwert und kodierten Merkmalen).

Vergiss die Prozentwerte. Gruppe nimmst Du als Dummy-Variable in die Regression auf, die Unterschiedlichkeit der Reaktion ist eine Wechselwirkung Gruppe*Merkmal.

Wie groß ist denn überhaupt Deine Fallzahl und wie viele Merkmale (Prädiktoren) willst Du simultan berücksichtigen? Falls Du nur wenige Fälle hast, geht die o.a. Regression nicht, dann kannst Du nicht mehrere Merkmale und Gruppen-Effekte/Wechselwirkungen simultan überprüfen. In dem Fall käme in Betracht, U-Tests zu rechnen mit Antwort als Gruppierungsvariable und oridinalem Textmerkmal als "abhängiger" Variable.
3. Frage: Wie kann ich überprüfen, ob die beiden Gruppen die kodierten Merkmale unterschiedlich nutzen oder nicht?

Das verstehe ich leider nicht. Woran kann man es denn erkennen, ob jemand ein Merkmal nutzt oder nicht?

Gruß

P.
---
Gottseidank...Kanon für 36
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11270
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Midori

Re: Regressionsverfahren und Skalenniveau

Beitragvon Midori » Mi 15. Jun 2011, 10:04

erstmal vielen Dank für deine schnelle Antwort!

Es sind insgesamt 16 Aussagen und 4 Merkmale (resp. Merkmalskategorien). Wie gesagt, werden die Merkmale im Text kodiert, gewichtet (einfach oder doppelt, je nach Ausprägung) und dann aufsummiert. Die Werte liegen so zwischen 0 und 25, also kommt hier die Dummy-Kodierung wohl eher nicht in Frage nehme ich an...

Tatsächlich fände ich es auch sinnvoller mit den Antworten der einzelnen Personen (ungefähr 23 Urteile pro Aussage) zu arbeiten, aber ich habe bisher keine Lösung gefunden, wie ich das schon nur von der Eingabe der Daten her bewerkstelligen könnte. Ich hätte ja die Aussagen als Fälle, dann als Varialben die Anzahl der verschiedenen Merkmale. Wie ich aber die Antworten jeder Person bei jeder Aussage kodieren könnte, ist mir unklar... Hast du da vielleicht eine Idee?

Zum Erkenne, ob jemand ein Merkmal nutzt: Die Merkmale wurden ja in den Texten kodiert. Wenn nun eine Ja-Antwort systematisch mit der Anzahl der vorliegenden Merkmale variiert, dann wäre die Annahme, dass dieses Merkmal (oder theortisch auch ein nicht-kodiertes, aber hochkorreliertes anderes Merkmal) von der Person für ihre Antwort genutzt wurde. Deshalb interessiert mich der Zusammenhang zwischen Antwort und Anzahl kodierter Merkmale in einer Aussage.

Beim U-Test sehe ich einfach nicht, ob denn überhaupt ein Zusammenhang zwischen Antwort und Merkmalshäufigkeit besteht, sondern "nur" den Gruppenunterschied... Wäre sonst evtl. eine Rangkorrelation eine Idee, mit anschliessender Überprüfung, ob die Korrelationen der beiden Gruppen sign. verschieden sind?
Midori
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Mi 15. Jun 2011, 08:45
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: Regressionsverfahren und Skalenniveau

Beitragvon PonderStibbons » Mi 15. Jun 2011, 11:17

Ich muss gestehen, jetzt verstehe ich nichts mehr. Texte, Merkmale, Aussagen, Antworten, Urteile pro Aussage...ich kapiere leider nicht, bei wem was wie erhoben wird, was die Untersuchungseinheit ist, was die AV und UV, das Untersuchungsziel und Analysziel sind mit diffus, und nicht mal die Fallzahl wurde genannt.

Vielleicht geht jemand anderem ein Licht auf, manchmal hat man ja ein Brett vor dem Kopf, ansonsten könnte es sein, dass Dein Anliegen im real life besser behandelt werden kann, wenn jemand Deine Unterlagen direkt vor Augen hat.

Viele Grüße

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11270
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts

Re: Regressionsverfahren und Skalenniveau

Beitragvon Midori » Mi 15. Jun 2011, 11:57

Vielleicht liegt es auch einfach an meiner Erklärung ;-) Ich versuche es nochmals:

Ich habe 16 Personen gebeten, zu einem Vorfall eine wahre oder eine falsche schriftliche Aussage zu machen.
Danach wurde für jede Aussage geschaut, ob bestimmte Merkmale (z.B. Details) vorliegen oder nicht --> Kodierung. Jedesmal wenn ein Merkmal in einer Aussage vorkommt wird entschieden, ob es eine leichte (einfache Gewichtung) oder eine starke (doppelte Gewichtung) Ausprägung hat. Wenn in einer Aussage z.B. ein Merkmal 4 x vorkommt, 3 x in leichter Ausprägung und 1 x in starker Ausprägung, gibt das einen Gesamtwert von 5 für dieses Merkmal. Das wurde für jede Aussage für verschiedene Merkmale so gemacht.

Dann hat man für jedes Merkmal in jeder Aussage einen bestimmten Wert = UV

Die Aussagen wurden dann verschiedenen Personen vorgelegt. Die Personen wurden gebeten zu beurteilen, ob eine Aussage ihrer Meinung nach wahr oder falsch ist. Dichotomes Urteil = AV

Nun möchte ich wissen, wie gut sich das Urteil der Personen durch die Merkmale (jede Aussage hat ja einen anderen Gesamtwert für verschiedene Merkmale) vorhersagen lässt. Deshalb die Idee mit der Regression.
Wenn es eine systematische Kovariation zwischen dem Gesamtwert eines Merkmals mit dem Urteil der Personen gibt, wird angenommen, dass sich die Personen an dem Merkmal (oder einem nicht erfassten, aber hochkorrelierten anderen Merkmal - wäre ja theoretisch möglich) bei ihrer Entscheidung orientiert haben.

Hinzu kommt nun, dass ich die Personen in zwei Gruppen aufgeteilt habe (die eine Gruppe hat viele richtige Urteile abgegeben, die andere nur wenige richtige). Hier frage ich mich, ob die Personen der beiden Gruppen sich an unterschiedlichen Merkmalen im Text orientiert haben.

Kannst du dir darunter etwas vorstellen?
Midori
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Mi 15. Jun 2011, 08:45
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: Regressionsverfahren und Skalenniveau

Beitragvon Claas » Mi 15. Jun 2011, 13:19

Hallo,

kann es sein, dass Du über RKZ schreibst?

Ich habe auch den Eindruck, dass Dir doch nichts anderes übrig bleibt, als den Prozentsatz der positiven Antworten zu benutzen.
Die Rangkorrelation desselben mit den gewichteten Merkmalssummen halte ich für eine gute Idee, entspricht am ehesten Deiner Fragestellung.

Liebe Grüße,
Claas
Claas
User
User
 
Beiträge: 49
Registriert: Fr 3. Jun 2011, 14:41
Wohnort: Berlin
Danke gegeben: 5
Danke bekommen: 17 mal in 17 Posts

folgende User möchten sich bei Claas bedanken:
Midori

Re: Regressionsverfahren und Skalenniveau

Beitragvon Midori » Mi 15. Jun 2011, 13:48

Hallo Claas,

Ja genau so ist es :-)

In dem Fall wäre ich mit meinen ersten Analysen ziemlich auf dem richtigen Weg (habe nämlich genau so angefangen)! Würdest du dann einfach testen, ob sich die Stärke der Korrelationen zwischen den beiden Gruppen unterscheiden (dazu findet sich ja sicher eine Formel im Bortz oder so)?

Ich denke, es ist nicht sinnvoll, die Berechnung für die Merkmale einzeln zu nehmen, sondern da würde ich auf die Subskalen zurückgreifen... Wäre hier eine Alpha-Korrektur angebracht? Es ist sowieso eine eher explorative Analyse zum Schluss der Arbeit...

Merci und liebe Grüsse,
Midori
Midori
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Mi 15. Jun 2011, 08:45
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: Regressionsverfahren und Skalenniveau

Beitragvon Midori » Mi 15. Jun 2011, 14:06

@Class

Kennst du dich gut mit RKZ aus? Ich habe nämlich einige Merkmale, die nie kodiert wurden und frage mich, ob ich die einfach gleich weglassen soll, da die ja mit Sicherheit nicht diskriminieren. Ausserdem habe ich 2-3 Kriterien, die nur ein einziges Mal und nur von einem Coder kodiert wurden... Die reissen die Reliabilität sowas von in den Keller (habe mir Spearmans Korrelationskoeffizient gerechnet) und da überlege ich auch, die einfach rauszunehmen... Ist dieses Vorgehen gerechtfertigt (würde natürlich in der Arbeit auch so erwähnt)?

Merci und lg
Midori
Midori
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Mi 15. Jun 2011, 08:45
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: Regressionsverfahren und Skalenniveau

Beitragvon Claas » Mi 15. Jun 2011, 14:19

Hallo Midori,

gut wäre zuviel gesagt, ich hatte halt schon mal im Rahmen eines Auftrags (als Statistikberater) mit einer Auswertung in dem Bereich zu tun.

Also an die einzelnen RKZ inhaltlich kann ich mich nicht mehr so gut erinnern.

Wegen des Vergleichs der Korrelationskoeffizienten:
Da Spearmans rho ja der über die Rangwerte gerechneten Produkt-Moment-Korrelation entspricht, sollte der Vergleich ebenfalls über die im Statistik-Bortz beschriebene Fisher-Z-Transformation möglich sein.

LG,
Claas
Claas
User
User
 
Beiträge: 49
Registriert: Fr 3. Jun 2011, 14:41
Wohnort: Berlin
Danke gegeben: 5
Danke bekommen: 17 mal in 17 Posts

folgende User möchten sich bei Claas bedanken:
Midori

Re: Regressionsverfahren und Skalenniveau

Beitragvon Midori » Mi 15. Jun 2011, 14:42

Hallo Claas

Ja natürlich! Ist mir gar nicht in den Sinn gekommen, dabei habe ich die Fisher-Z-Transformation bereits bei der Reliabilitätsberechnung der Skalen gebraucht um den Mittelwert über die verschiedenen Merkmale berechnen zu können! Merci!

Würdest du denn aus statistischer Sicht sagen, dass Merkmale, die kaum oder nur äusserst schlecht diskriminieren (eben z.B. weil sie (fast) nie kodiert wurden) und bei einzelnem Auftreten eine sehr niedrige Reliabilität aufweisen, unberücksichtigt bleiben dürfen?

Lg
Midori
Midori
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Mi 15. Jun 2011, 08:45
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 3 Gäste