Variable vorhersagen

Fragen, die sich auf kein spezielles Verfahren beziehen.

Variable vorhersagen

Beitragvon Gismogasmo » Di 21. Mär 2017, 13:44

Hallo zusammen,

ich habe mal eine Frage nach einem Lösungskonzept. Folgendes Problem:

Ich habe 4 Variablen, von denen allerdings einige Lücken aufweisen. Sprich, es gibt fehlende Werte.
Dazu habe ich 20 weitere Variablen ( ebenfalls mit fehlenden Werten), mit dessen Hilfe ich die ersten 4 Variablen für die fehlenden Fälle schätzen soll.
Sprich, ich muss einen Weg finden die 4 Variablen mithilfe der 20 Variablen zu beschreiben.

Im Grunde läuft das doch auf eine Regression heraus oder? Wenn ja, wie finde ich dann die Regressionskoeffizienten?

Danke schonmal!
Gismo
Gismogasmo
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 21. Mär 2017, 13:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Variable vorhersagen

Beitragvon PonderStibbons » Di 21. Mär 2017, 14:49

Wie lautet denn das Thema der Studien, wie wurden die Daten erhoben, wie groß ist die Stichprobe, was messen die 4 Variablen konkret und auf welchem Skalenniveau, wie groß ist der Anteil fehlender Werte bei den 4 Variablen, wie viele Probanden haben mindestens 1 fehlenden Wert, was messen die 20 anderen Variablen? Und ist es richtig, dass Deine Frage lautet, wie man mithilfe der 20 zusätzlichen Variablen die fehlenden Werte bei den ersten 4 Variablen ersetzen kann? Regression wäre dann schonmal nicht optimal.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

Re: Variable vorhersagen

Beitragvon Gismogasmo » Di 21. Mär 2017, 15:18

Hi,

vielen Dank für die schnelle Antwort. Es geht um Konsumverhalten. Die 4 Variablen die ich habe sind Alter (5 Klassen), Einkommen(5 Klassen), Bildung(5 Klassen) und Geschlecht. Die anderen Variablen sind nicht benannt. Sind alles Werte zwischen 0 und 1000. Es gibt keinen Probanden mit allen Werten. Insgesamt beträgt der Stichprobenumfang 20000.

Ja, genau. Das ist richtig ! :)

LG Gismo
Gismogasmo
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 21. Mär 2017, 13:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Variable vorhersagen

Beitragvon strukturmarionette » Di 21. Mär 2017, 16:36

Hi,

Die anderen Variablen sind nicht benannt.

- Ist das ernstgemeint?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4312
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 582 mal in 579 Posts

Re: Variable vorhersagen

Beitragvon Gismogasmo » Di 21. Mär 2017, 18:19

Ja, leider. Ich hab mir das nicht ausgesucht. Ich weiß nicht was das für Variablen sind. Außerdem sind diese total unvollständig. Die bekomme ich auch mit einer Hot Deck Imputation beispielsweise nicht wirklich gebändigt.

VG
Gismogasmo
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 21. Mär 2017, 13:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Variable vorhersagen

Beitragvon PonderStibbons » Di 21. Mär 2017, 19:25

Da wäre ein bißchen Kontext vielleicht nützlich. Was sind das für Daten,
woher stammen sie, wer hat Dir den Arbeitsauftrag gegeben und was ist
der Zweck der Übung?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

Re: Variable vorhersagen

Beitragvon Gismogasmo » Di 21. Mär 2017, 19:29

Hi,

das ist eine Übung für einen Statistik-Kurs. Woher diese genau stammen weiß ich nicht. Zweck ist einfach üben. :)

LG
Gismogasmo
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 21. Mär 2017, 13:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Variable vorhersagen

Beitragvon PonderStibbons » Di 21. Mär 2017, 20:02

Damit kann ich leider so gar nichts anfangen. Das Anspruchsniveau an die Lösung ist unbekannt, die Daten sind trotz zudem sehr schlecht beschrieben... - Falls es um die Auswahl von Regressionsverfahren geht, da kommen binär logistische, ordinal logistische und nominale in Betracht, je nach Skalenniveau der abhängigen Variable.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11228
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 49
Danke bekommen: 2467 mal in 2451 Posts

Re: Variable vorhersagen

Beitragvon Gismogasmo » Di 21. Mär 2017, 20:25

Genau das ist auch mein Problem. Es gibt einfach keine weiteren Informationen. Ich habe mal durchgeschaut. Insgesamt sind 80% der Daten missing values.. Da macht eigentlich gar nichts wirklich sinn oder? Es gibt keine Spalte und keine Zeile die komplett ist.

Danke nochmal!
Gismogasmo
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Di 21. Mär 2017, 13:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Variable vorhersagen

Beitragvon bele » Mi 22. Mär 2017, 13:03

Also ist das alles mehr so eine Art Knobelspiel und weil man keine Voraussetzungen kennt, kann man auch keine übersehen. Bequemer kann man es doch kaum haben. Unter diesem Umständen würde ich das als Regressionsaufgabe sehen. Es gibt Klassifikationsbäume und Random-Forest-Regressionen, die mit fehlenden Werten sehr gut umgehen können, weil sie Alternativ-Splits machen, wo Daten fehlen (ctree() mit maxsurrogate > 0: https://cran.r-project.org/web/packages ... /ctree.pdf ). Sowas könnte man machen. Oder halt eine Reihe von linearen Regressionen unter Auslassung der jeweils fehlenden Variable.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5748
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1343 mal in 1330 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 5 Gäste