Regressionsanalyse - Problem mit Sample Size/Datensatz?

Alle Verfahren der Regressionanalyse.

Regressionsanalyse - Problem mit Sample Size/Datensatz?

Beitragvon stats_dz » Fr 19. Mai 2017, 13:15

Hallo zusammen,

ich habe folgendes Problem. Ich möchte gerne eine binomiale Regressionsanalyse machen. Dazu habe ich eine abhängige nominale variable mit 2 Ausprägungen(ja/nein) und 6 unabhängige Variablen (2 ebenfalls nominale variablen mit 2 ausprägungen (ja/nein) und 4 Scale Variablen.

Insgesamt habe ich 1500 Datensätze, wenn ich die binomiale Regression hierrauf anwende kriege ich signifikante und ganz gute Ergebnisse raus (alle bis auf eine Skala-Variable sind da zumindest signifikant).
Jetzt möchte ich meine 1500 Fälle anhand einer weiteren Variable (Sprache: Deutsch/Englisch) splitten, also habe ich jeweils eine binomiale Regression auf 750 Fälle: Hier kommen auch ganz gute Ergebnisse raus, aber die sind schon ein bisschen schlechter als wenn ich diese Unterteilung nicht mache, aber wie ich denke immernoch zu gebrauchen.

Jetzt möchte ich gerne noch eine Unterteilung anhand einer weiteren Variable (Kategorie: 1,2,3,4,5) machen in fünf weitere "Stufen", also beträgt mein Datensatz hierbei pro Sprache pro Kategorie 150 (750/5). Hierbei habe ich allerdings das Problem, dass ich für die binomiale Regression pro Kategorie (also Datensatz von jeweils 150) nur echt schlechte werte rauskriege (so gut wie gar nichts ist signifikant, allerhöchstens mal zwei, eher aber nur mal eine unabhängige Variable).

Kann das sein? Habe ich einfach Pech auf "Kategorieebene"? Und kann es sein, dass wenn ich alle 1500 Fälle zusammen, ohne Unterteilung, betrachte, dass ich dort gute/signifikante Werte herauskriege? Ich mach das ganze übrigens mit SPSS falls es relevant ist.

Ich würde mich über jede Hilfe/Ideen sehr freuen!

Vielen Dank schonmal!
stats_dz
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 19. Mai 2017, 13:04
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse - Problem mit Sample Size/Datensatz?

Beitragvon bele » Fr 19. Mai 2017, 15:19

Hallo stats_dz,

es klingt so, als würdest Du "gute" und "signifikante" Ergebnisse gleich setzen. Ein kleiner Effekt, wird bei großen Fallzahlen signifikant. Es wird also wohl Effektstärken geben, die bei n = 1500 signifikant werden, bei n = 150 nicht. Bis dahin wäre das völlig normal.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5771
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1353 mal in 1340 Posts

folgende User möchten sich bei bele bedanken:
stats_dz

Re: Regressionsanalyse - Problem mit Sample Size/Datensatz?

Beitragvon stats_dz » Sa 20. Mai 2017, 01:47

Hallo Bernhard,

vielen Dank für deine Antwort!
Ja, da habe ich mich wohl etwas unglücklich ausgedrückt. Du willst sicherlich auf die Odds Ratios (Exp(B) in SPSS) hinaus oder? Also mir ist bewusst, dass "gut" und "signifikant" zwei unterschiedliche Sachen sind. In der Tat habe ich bei n=1500 relativ geringe Odds Ratios (zwischen 1,05 und 2,23). Das ist ja schon sehr gering.
Ich verstehe allerdings nicht, wieso ein kleiner Effekt bei einer großen Fallzahl signifikant wird und bei einer kleinen nicht. Kannst du das vielleicht kurz ausführen, wieso das so ist? Oder mir Literatur verlinken/Stichworte nennen wo ich eine Erklärung finde/wonach ich suchen kann? Ich habe keine wirkliche Erklärung dazu gefunden
Ich bedanke mich nochmal für deine Antwort, das hat mir schon ein Stückchen weitergeholfen :)

Edit: Oder beziehst du dich auf die Effektstärke z.B. nach Cohen? Wobei bei n=150 ich zum Teil nach Cohen höhere Effektstärken berechne, wobei die unabhängigen Variablen jedoch nicht signifikant sind. Dennoch finde ich leider keine Erklärung dazu, inwiefern die Fallzahl eine Rolle spielt.

LG
stats_dz
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 19. Mai 2017, 13:04
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse - Problem mit Sample Size/Datensatz?

Beitragvon PonderStibbons » Sa 20. Mai 2017, 11:47

Beim Signifikanztest wird ein aus den Stichproben-Daten geschätzter Effekt (Mittelwertunterschied, Odds Ratio, Korrelationsmaß etc.) in Beziehung gesetzt zu seinem Standardfehler. Ein Standardfehler ist größer, wenn er auf wenigen Beobachtungen beruht. Schätzungen, die hingegen auf sehr vielen Beobachtungen beruhen, haben einen kleineren Standardfehler.

Kennt man den geschätzen Effekt und den Standardfehler, dann kann man berechnen, ob das 95% Konfidenzintervall des geschätzen Effekts den Wert Null einschließt (bzw. im Falle der odds ratio den Wert 1) oder nicht. Konfidenzintervalle sind schmal um den geschätzen Effekt herum, wenn die Stichprobe groß und der Standardfehler daher klein ist. Konfidenzintevalle sind breit um den Effekt herum, wenn die Stichprobe klein ist. Schließt das Konfidenzintervall die 0 ein (bzw. bei OR die 1), wird die Nullhypothese beibehalten.

Für eine OR von 1,5 kann bei einer großen Stichprobe das 95%-Konfidenzintervall z.B. [1,1 bis 1,9] betragen, bei einer kleinen hingegen z.B.[0,8 bis 2,2]. Im letzteren Fall umfasst es den Wert 1 und die Nullhypothese ("In der Grundgesamtheit beträgt die OR genau 1") kann nicht verworfen werden.

Mit freundichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11254
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2469 mal in 2453 Posts

folgende User möchten sich bei PonderStibbons bedanken:
stats_dz

Re: Regressionsanalyse - Problem mit Sample Size/Datensatz?

Beitragvon stats_dz » Di 23. Mai 2017, 22:00

Hallo nochmal,

vielen lieben Dank für die gute Erklärung! :) Du hast mir sehr geholfen!
stats_dz
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 19. Mai 2017, 13:04
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 4 Gäste

cron