Seite 1 von 1

Umgang mit fehlenden Werten

BeitragVerfasst: Do 19. Jan 2017, 18:12
von Senzafine
Hallo Leute!

Folgendes Problem: Wir haben Daten aus einem Spiel mit mehreren Spielzügen. Leider sind diese Spielzüge von Proband zu Proband unterschiedlich lang (kürzeste= 37, längste= 62 Züge), so dass sich daraus fehlende Werte, besonders am Ende der Datenreihe, ergeben. Wie können wir jetzt mit diesen fehlenden Werten umgehen? Vorzugsweise würden wir diese gern auf den kleinsten gemeinsamen Nenner (37) "abschneiden". Dies hätte allerdings zur Folge, dass dann etwa die Hälfte der Daten verloren geht, die für uns inhaltlich aber auch nicht so wichtig sind. Die Frage ist nun, ob wir das einfach so machen können und wenn ja, wie wir das statistisch begründen (Quelle?)...?

Über Hilfe wären wir sehr dankbar! :)

Re: Umgang mit fehlenden Werten

BeitragVerfasst: Do 19. Jan 2017, 21:33
von PonderStibbons
Wie lautet denn das Thema und die Fragestellung der Studie, das Studiendesign, was wurde gemessen, was ist das für eine Stichprobe und wie groß ist sie?

Mit freundlichen Grüßen

PonderStibbons

Re: Umgang mit fehlenden Werten

BeitragVerfasst: Do 19. Jan 2017, 22:20
von JaLo
Hallo

Ich arbeite ebenfalls an diesem Datensatz. Es geht um Daten eines Trust Games, wo Probanden mit 4 virtuellen Spielern spielen, von denen sie glauben sollen, dass es Menschen sind. Proband ist abwechselnd Trustor (Ausgangswert/Guthaben + Überweisung an einen Mitspieler) und Trustee (erhaltene Überweisung von einem Mitspieler+Abgabe zurück). Wir haben 102 Probanden und pro Spielzug folgende Daten Gesamtwert/Guthaben und Ausgangswert+Abgabe oder erhaltener Wert+Abgabe. Die Überweisungen verdreifachen sich jeweils beim Empfänger. Davor gibt es per Balltossing eine induzierte soziale Ausgrenzung (oder Inklusion oder KG). Dieser Anteil ist bei uns beiden gleich, wir untersuchen nur jeweils andere Konstrukte an diesem Experiment, ob dadurch etwas am Verhalten in beiden Spielen verändert wird)

Allerdings sind die Spielzüge unterschiedlich in der Anzahl, wie schon beschrieben. Rein inhaltlich würden vermutlich auch die ersten 5 Spielzüge reichen. Es gibt auch Studien, die mit einem Spielzug auskommen. Aber wir haben aufgrund eines größeren Projekte wesentlich mehr Daten zur Verfügung und die eigentliche Frage ist, wie wir es begründen, so viel davon einfach zu eliminieren, anstatt sie zu nutzen. Eine andere Möglichkeit, wäre es die fehlenden Spielzüge sinnvoll zu ergänzen, aber von dem was wir bisher gelesen haben, übersteigt das unser Können. Und es bleibt die Frage, wie sinnig das ist, wenn auch 5 Spielzüge schon sehr ausreichend wären. Nur eine statistische Begründung wäre schön. Zum Beispiel wäre eine inhaltliche Begründung, dass Vertrauen oder die Bereitschaft zu kooperieren sich mit der Zeit verändert und dies einen zu großen Einfluss nimmt (man mag einen Spieler mehr als den anderen und füttert den künstlich hoch, sodass man immer mehr zurück bekommt oder die reine Gewinnabsicht wird stärker). Ich hoffe, so wird es deutlicher.

Re: Umgang mit fehlenden Werten

BeitragVerfasst: Do 19. Jan 2017, 23:30
von JaLo
Ich habe vergessen zu erwähnen, dass die virtuellen Spieler intelligent angelegt sind. Zwar spielten alle Agenten fair, dennoch unterscheiden sich die Beträge bedeutend voneinander.

Re: Umgang mit fehlenden Werten

BeitragVerfasst: Fr 20. Jan 2017, 03:05
von strukturmarionette
Hi,

- ihr könntest zunächst schauen, was es diesbezüglich an theoretischen Konzepten gibt
- dann (zumindest) eine Fragestellung formulieren
- dann prüfen ob und inwieweit Eure Rohdaten geignet sind, diese Fragestellung (statistisch) zu beantworten

Gruß
S.

Re: Umgang mit fehlenden Werten

BeitragVerfasst: Fr 20. Jan 2017, 08:41
von forenthomas
Hallo,

ihr wollt eine
statistische Begründung
wo ihr aber meines Erachtens inhaltlich begründen müsst. Die Statistik liefert die Zahlen, statistische Methoden haben Voraussetzungen die ein Begründung liefern können, warum man sie anwendet oder auch nicht anwendet. Wenn ihr dann eine Methode anwenden wollt bzw. müsst, die gleiche Datensatzlängen voraussetzt, dann müsst ihr halt inhaltlich begründen, warum es richtig ist, die restlichen Antworten zu vernachlässigen.

Spannender erscheint mir erst mal die inhaltliche Interpretation. Warum habt ihr denn unterschiedliche Längen? Gibt es da Auffälligkeiten zwischen den Gruppen? Haben die einen keine Lust mehr? Warum? Oder haben sie ihr Ziel schneller erreicht? Warum? Und wenn ihr das alles nicht vorher als zu überprüfendes Konstrukt herausgearbeitet habt, dann seit ihr eigentlich in einer hypothesengenerierenden Phase, nicht in einer prüfenden. Denn wenn ihr prüfen wollt, müsst ihr die Frage (eigentlich) vorher definieren.

Gruß, Thomas

Re: Umgang mit fehlenden Werten

BeitragVerfasst: Fr 20. Jan 2017, 21:10
von Senzafine
Hallo!

Vielen Dank für die Antworten! :)

@Thomas: Auf die Länge der Züge haben die Probanden keinen Einfluss, das entscheidet das Programm zufällig. Wir haben das leider nicht programmiert, ansonsten hätten wir die Züge gleich lang gemacht. Auch gab es ein paar Abstürze, die wir aber dennoch gern mit in die Berechnungen einbeziehen wollten.

Zur Untersuchungsfrage: Wir haben ja, wie gesagt, unterschiedliche Gruppen, die vor diesem besagten Spiel ja noch ein anderes Spiel (Ball-Tossing) mit jeweils unterschiedlichen Bedingungen (Inklusion/Exklusion/KG) gespielt haben. Die Frage ist jetzt, ob sich diese Gruppen im Trust-Game im Verhalten unterscheiden.
Wir wollten mit diesem Spiel jedoch nicht unbedingt Vertrauen messen, sondern eher so etwas wie Kooperation/positives Sozialverhalten. Je höher die Werte, desto kooperativer die Probanden. Wenn wir davon ausgehen, dass sich Kooperation im Laufe der Zeit verändert (durch Erfahrungen im Trust-Game) und die Gruppen untereinander vergleichen wollen, müssten wir dann nicht in etwa gleich lange Züge haben, damit wir das überhaupt dürfen?
Und falls nicht, wie müssten wir dann mit den fehlenden Werten umgehen? Sie sind ja quasi nur entstanden, weil es Komplikationen gab oder das Programm nicht normiert war und sind somit nicht von inhaltlichem Interesse.

Liebe Grüße!

Re: Umgang mit fehlenden Werten

BeitragVerfasst: Sa 21. Jan 2017, 12:05
von JaLo
Schon mal Danke für die Antworten!

Mit "statistisch" meinte ich das Festlegen einer willkürlich Grenze, die alle Spieler angleicht, aber dadurch für eine hohen Datenverlust sorgt. Das Problem gibt es vermutlich öfter und es ist tatsächlich mehr inhatlicher Natur. Im Prinzip eliminieren wir damit alle fehlende Werte und alles ist gut. Ist das aber dann nicht verfälschend? Wir haben ja die Daten.

Und eine zweite, davon unabhängige Geschichte ist, dass man sich rein theoretisch auch den Verlauf der Spielzüge, also das Vertrauen über die Zeit hinweg angucken könnte. Dann stünde das Problem mit den fehlenden Werten noch mehr im Vordergrund.