Seite 1 von 1

Multiple lineare Regression

BeitragVerfasst: Sa 24. Nov 2018, 00:18
von AmSi
Hallo miteinander,

ihm Rahmen meiner Bsc Arbeit versuche ich mich an einer empirischen Analyse der Relevanz von Authentizität als Erfolgsfaktor in der Musikindustrie.
Außer einem Einführungskurs Statistik im ersten Semester, besitze ich kein weiteres Statistikwissen und drücke mich wahrscheinlich statistisch nicht immer korrekt aus.
Ich versuche jedoch die Sachlage möglich genau zu schildern und hoffe auf Verständnis :)

So nun denn... was ich habe:
N = 400 (sofern Zeit bleibt werde ich den Datensatz noch erhöhen, muss aber jetzt erstmal damit arbeiten)

Abhängige Variable:
Punkte (basierend auf dem Chartserfolg des eines Songs)

Variablen, die Authentizität abbilden sollen:
Credits (wird der Interpret in den Credits des Songs genannt): Nein, Ja bez. 0,1 als Faktor definiert
PI (entspricht der Produzent dem Interpreten): Nein, Ja bez. 0,1 als Faktor definiert
Lang (entspricht die Songsprache der Muttersprache des Interpreten) : Nein, Ja bez. 0,1 als Faktor definiert
LK (Labelklasse, Labels in 4 Kategorien eingeteilt): Major, Flagship, RecordCompany, Independent als Faktor definiert

Kontrollvariablen:
Form (des Interpreten): Solo, Band, Kooperation als Faktor definiert
Voice (Geschlecht der Hauptstimme) m, f, mix, inst als Faktor definiert
Co-Autoren: Anzahl
Co-Produzent: Anzahl
Lengh: Dauer des Songs
HG1 (Genreeinteilung 1) Rock, Pop, Sonstiges, Elektronische Musik, Rap/Hip-Hop als Faktor definiert
Hg2 (Genreeinteilung 2) Rock, Pop, Sonstiges, Elektronische Musik, Rap/Hip-Hop als Faktor definiert

Nun habe ich das Problem, dass nicht jeder Song in 2 Genre gehört. Manche sind einfach "nur" Rock, während andere halt "zwingend" Pop und Elektronischer Musik angehören.
Was mache ich in diesem Fall mit HG2?
Im Moment sind die Felder leer, weswegen mir der erste Versuch in R-Studio wohl um die Ohren geflogen ist. Ich hoffe zumindest, dass nur das ein Problem ist und der Rest ganz okay ^^

Call:
lm(formula = Punkte ~ Lang + PI + LK + Credits + Vocals + Form +
CoProduzenten + CoAutoren + HG1 + HG2 + Lengh)
(237 observations deleted due to missingness)

Freue mich über Hilfe und Feedback

Viele Grüße

Amanda

Re: Multiple lineare Regression

BeitragVerfasst: Sa 24. Nov 2018, 02:07
von strukturmarionette
Hi,

Im Moment sind die Felder leer, weswegen mir der erste Versuch in R-Studio wohl um die Ohren geflogen ist. Ich hoffe zumindest, dass nur das ein Problem ist und der Rest ganz okay ^^
Call:
lm(formula = Punkte ~ Lang + PI + LK + Credits + Vocals + Form +
CoProduzenten + CoAutoren + HG1 + HG2 + Lengh)
(237 observations deleted due to missingness)

http://www.r-forum.de/

Gruß
S.

Re: Multiple lineare Regression

BeitragVerfasst: Sa 24. Nov 2018, 02:23
von AmSi
Vielen Dank für den Link.
Ich kenne das R-Forum, habe mich aber bewusst für das Statistikforum entschieden, weil ich Hilfe zum Umgang mit den Variablen HG1 und HG2 benötige und das Problem doch eher methodischer Natur scheint.
Das Problem ist doch unabhängig davon welches Peogramm ich für die Auswertung nutze...?

Dachte ich zumindest...

Re: Multiple lineare Regression

BeitragVerfasst: Sa 24. Nov 2018, 13:51
von PonderStibbons
Einige Optionen:
* Nach sachkundigem Vorverständnis auf Basis der vorhandenen Angaben neue Kategorien bilden ("Pop", "Poprock", "Elektropop", "Rock"...)
* 5 Variablen bilden (Rock, Pop, Elektronische Musik, Rap/Hip-Hop, Sonstiges) und bei jeder ja/nein als Antwortangaben verwenden.
* 10 Variablen bilden (Rock primär, Rock sekundär, Hip-Hop primär, Hip-Hop sekundär, etc.) .

Mit freundlichen Grüßen

PonderStibbons

Re: Multiple lineare Regression

BeitragVerfasst: Mo 26. Nov 2018, 11:03
von AmSi
*5 Variablen bilden (Rock, Pop, Elektronische Musik, Rap/Hip-Hop, Sonstiges) und bei jeder ja/nein als Antwortangaben verwenden.


Guter Input, vielen Dank, so mach ich das.