Seite 1 von 1

Auswahl der geeigneten Regressionsanalyse

BeitragVerfasst: Mo 29. Jul 2019, 08:59
von Elias_Sandorin
Hallo Zusammen,

ich überlege derzeit, ob ich mit der Auswahl einer normalen OLS-Regression für folgenden Sachverhalt richtig liege und möchte daher kurz die Meinung des Forums hierzu erfahren:

1. Es wurde eine inhaltsanalytische Auswertung durchgeführt. Ziel: Ermittlung der Anzahl bestimmter "Elemente" (AV), wobei die Maximalanzahl der Elemente 7 beträgt (unabhängig von Textvolumen, etc.).
2. Als UVs wurden unternehmensspezifische Kennzahlen (Bilanzsumme, Anzahl der Aktionäre, etc.) genutzt; allesamt metrisch skaliert, d.h. sowohl verhältnisskaliert als auch intervallskaliert.

An dieser Stelle überlege ich, wie genau meine abhängige Variable zu behandeln ist und wie sich dies auf die "richtige" Auswahl des Typs von Regressionen auswirkt. Grundsätzlich ist es wichtig, dass die AV mindestens metrisch skaliert sein sollte.

Kann ich meine eigenständige Einordnung der Texte von bspw. Unternehmen 1 (3 identifizierte Elemente) und Unternehmen 2 (6 identifizierte Elemente) als eine Art 7er-Likert-Skala betrachten und meine AV in dieser Form operationalisieren?

Falls ja, eignet sich dann eine schlichte OLS-Regression, unabhängig davon ob die (Gaußov-Markov-)Annahmen zutreffen?

Falls nicht, worauf ist zu achten und welchen Typ von Regression ist anzuwenden?

Vielen Dank für die Antworten! :)

Re: Auswahl der geeigneten Regressionsanalyse

BeitragVerfasst: Mo 29. Jul 2019, 09:33
von PonderStibbons
kann ich meine eigenständige Einordnung der Texte von bspw. Unternehmen 1 (3 identifizierte Elemente) und Unternehmen 2 (6 identifizierte Elemente) als eine Art 7er-Likert-Skala betrachten und meine AV in dieser Form operationalisieren?

Wo ist die Verbindung? Likert-Skalen bestehen aus mehreren Items des Likert-Typs
(mit Likert-Frage- und -Antwortformat), deren Scores addiert werden. Deine Zählung hat
aber auch nichts mit dem siebestufigen Antwortformat eines einzelnen Likert-Items zu tun.
Und selbst wenn, dann würde es bedeuten, dass Du Deine AV nicht als intervallskaliert
betrachten kannst, sondern als ordinalskaliert, ebenso wie ein einzelnes Likert-Item
nur ordinalskaliert ist (im Unterschied zur Likert-Skala, die meist als intervallskaliert
behandelt wird).

Für Zähldaten kann man gewöhnlich Poisson-, negative Binomial-, oder mit den bekannten
Problemen lineare Regression in Betracht ziehen.

Mit freundlichen Grüßen

PonderStibbons

Re: Auswahl der geeigneten Regressionsanalyse

BeitragVerfasst: Mo 29. Jul 2019, 10:35
von strukturmarionette
Hi,

1. Es wurde eine inhaltsanalytische Auswertung durchgeführt. Ziel: Ermittlung der Anzahl bestimmter "Elemente" (AV)

- ?

Gruß
S.

Re: Auswahl der geeigneten Regressionsanalyse

BeitragVerfasst: Mo 29. Jul 2019, 11:06
von bele
PonderStibbons hat geschrieben:Für Zähldaten kann man gewöhnlich Poisson-, negative Binomial-, oder mit den bekannten
Problemen lineare Regression in Betracht ziehen.


Hallo Forum,

da es hier eine maximale Anzahl von 7 gibt, hatte ich zunächst nicht an ein Poisson, sondern an ein binomiales Regressions-Modell gedacht. Nun hat aber wahrscheinlich nicht jedes dieser 7 Items die gleiche Wahrscheinlichkeit, in einem Item aufzutauchen und deshalb muss man sich über das Vorgehen für den Fall eines schlechten Modelfits machen. Da finde ich die Parallele zu Fragebögen, in denen 7 Items abgefragt und jeweils mit Ja oder Nein beantwortet werden, gar nicht so weit hergeholt (Thema wurde im Interview angesprochen? Ja/Nein). Ich würde etwas, das mit Ja/Nein beantwortet wird, persönlich nicht Likert-Item nennen, aber so ungewöhnlich ist das Bilden von Summenscores bei Ja/Nein-Items dann auch wieder nicht, dass die Idee mit dem quasi-metrischen völlig aus der Welt wäre. Auch dann würde ich natürlich keine OLS-Regression vorschlagen.

Grüße,
Bernhard

Re: Auswahl der geeigneten Regressionsanalyse

BeitragVerfasst: Mo 29. Jul 2019, 11:52
von strukturmarionette
Hi,

- auch: N?

Gruß
S.

Re: Auswahl der geeigneten Regressionsanalyse

BeitragVerfasst: Mo 29. Jul 2019, 12:23
von PonderStibbons
bele hat geschrieben:[Nun hat aber wahrscheinlich nicht jedes dieser 7 Items die gleiche Wahrscheinlichkeit, in einem Item aufzutauchen

Das leuchtet ein. Ordinal-logistische Regression wäre das, was mir sonst noch einfiele.

Re: Auswahl der geeigneten Regressionsanalyse

BeitragVerfasst: Di 30. Jul 2019, 07:07
von Elias_Sandorin
Hallo Zusammen,

danke für die bisherigen Rückmeldungen. Mein Gedankengang war tatsächlich der, den Bernhard beschrieben hat. Dennoch möchte ich die Identifikation der einzelnen Elemente genauer erläutern, um ebenfalls strukturmarionettes Frage zu beantworten:

1. Es gibt eine Art "Kriterienkatalog" für einen bestimmten Managementstandard, bestehend aus sieben eindeutig beschriebenen und klar voneinander differenzierenden Elementen.
2. Diese Elemente habe ich aus den Textabschnitten der jeweiligen Geschäftsberichte extrahiert; N = 102.
3. Die Zuordnung erfolgt durch eine schlichte dichotome Entscheidung, wie bereits richtig beschrieben: Ja/Nein-Entscheidung für jedes einzelne Element.

Schlussendlich hatte ich mir meine Regressionsgleich in dieser Form vorgestellt:

Anzahl der Elemente (AV) = Konstante + beta(i)[für verschiedene Agency-, Risk- und Corporate Governance Variablen) + Störterm

@PonderStibbons:
Wie robust sind Poisson- bzw. negative Binomialregression? Gibt es diesbezüglich etwas zu beachten?
Gleiches für ordinal-logistische Regression.

Viele Grüße

Re: Auswahl der geeigneten Regressionsanalyse

BeitragVerfasst: Di 30. Jul 2019, 08:19
von strukturmarionette
Hi,

beta(i)[für verschiedene Agency-, Risk- und Corporate Governance Variablen)

- wie viele UVs sind es?

Vielleicht könntest Du auch je AV-Element (Ja /Nein) eine binär logistische Regression berechnen.
Oder für alle 'AV-Elemente' ein einiziges Multinomiales Regressionsmodell.

Gruß
S.

Re: Auswahl der geeigneten Regressionsanalyse

BeitragVerfasst: Di 30. Jul 2019, 08:34
von Elias_Sandorin
Hallo,

es sind laut aktuell sieben UVs, wobei ich eher dazu tendiere zwei Variablen rauszunehmen, ergo fünf.

Die Idee mit sieben einzelnen binär logistischen Regressionen klingt nicht schlecht, wobei ich nicht genau abschätzen kann, welchen Informations(mehr)wert ich verlieren würde, wenn nicht die komplette Range von sieben AV-Elementen integriert werden würde. :?: Da klingt die Lösung mit dem multinomialen Regressionsmodell etwas sinnvoller. Inwiefern lassen sich für beide Nachteile konstatieren?

Viele Grüße

Re: Auswahl der geeigneten Regressionsanalyse

BeitragVerfasst: Fr 3. Jan 2020, 18:31
von Elias_Sandorin
Hallo Zusammen,

zwischenzeitlich habe ich mich für die Poisson-Regression entschieden, da sich diese für Zähldaten etabliert hat.
Jedoch hänge ich derzeit an einem Formulierungsproblem bezüglich des nicht vorhandenen R² bzwm adjusted R².

Wie genau lässt sich begründen, dass es kein Bestimmtheitsmaß (zumindest laut SPSS, aber auch aus der formaltechnischen Vorgehensweise) bei der Poisson-Regression gibt?
Erklärungen an dieser Stelle und/oder Hinweise zu Quellen sind willkommen, da ich leider keine einschlägige Belege gefunden habe.

Viele Grüße