Unterschied Regressionskoeffiizient/Korrelationskoeffizient

Bivariate Korrelation, partielle Korrelation und Rangkorrelation.

Unterschied Regressionskoeffiizient/Korrelationskoeffizient

Beitragvon Spaich » Fr 27. Nov 2015, 13:45

Hallo Leute,

ich habe eine kleine Frage zum Regressionskoeffizienten und zum Unterschied Regression/Korrelation.


Ich habe folgendes Beispiel in einem Statistik zur Signifikanz des slopes einer Regressionsgeraden nicht verstanden:

Beispiel Senfsamen:
"In a pot experiment with many replications of different densities of mustard seeds, it was suggested by someone that it would be too tedious to count out the seeds individually, and that “guesses” might be near enough. One person therefore took samples of mustard seeds from a bowlwith a teaspoon, made a quick guess of the number of seeds in the spoon, and then passed the spoon to a colleague for an accurate count of the seeds it contained. A regression analysis of the actual number of seeds (y) on the guess (x) was carried out to see how accurately the actual number could be predicted from the instant guess."

a) Für die Steigung b wurde 0,96 berechnet. Der Kommentar im Statistikbuch ist: "In otherwords,each extra seed in the guess is on average worth just less than one actual seed–very close indeed!"Aber die Steigung der Regressionsgerade zeigt mir doch nie an, wie gut der Zusammenhang ist?! Ich muss ja nun erst einmal testen, ob die Steigung der Regressionsgerade signifikant verschieden zu einer Geraden ohne Steigung ist?

b) Dann noch zur Frage Unterschied Korrelation/Regression:
Mir ist klar, dass man die Korrelation bei zwei Variablen berechnet, um die Stärke des Zusammenhangs zwischen den zwei Variablen zu quantifizieren. Bei der Regression untersucht man die Art des Zusammenhangs, man schaut also, wie gut sich eine vermeintlich abhängige Variable mit Hilfe der vermeintlich unabhängigen Variablen erklären lässt mit Hilfe eines linearen Modells.
Im Grunde genommen teste ich doch nun auch mit der Signifikanz der Regressionsgeraden, wie gut der Zusammenhang zwischen den zwei Variablen ist? Also ist das doch jetzt ähnlich, wie der Korrelationskoeffizient? Wenn ich also einen hohen Korrelationskoeffizienten berechne und ich die richtige Annahme treffe, welche Variable abhängig und welche unabhängig ist, müsste ich eigentlich auch eine hohe Signifikanz für die Steigung bekommen, oder?

Ich würde mich sehr freuen, hier eine Antwort zu bekommen, ich komme an diesem Punkt gerade einfach nicht weiter, danke:)

VG Fabi
Spaich
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 27. Nov 2015, 13:03
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Unterschied Regressionskoeffiizient/Korrelationskoeffizi

Beitragvon PonderStibbons » Fr 27. Nov 2015, 13:57

Aber die Steigung der Regressionsgerade zeigt mir doch nie an, wie gut der Zusammenhang ist?!

Die Steigung zeigt Dir an, wie hoch der Zusammenhang in der Stichprobe ist.
Nichts anderes tut der zitierte Abschnitt.
Ich muss ja nun erst einmal testen, ob die Steigung der Regressionsgerade signifikant verschieden zu einer Geraden ohne Steigung ist?

Nur wenn Dich die Verwerfung der Hypothese "In der Grundgesamtheit ist die Steigung = 0,000000..." interessiert.

Also ist das doch jetzt ähnlich, wie der Korrelationskoeffizient?

Der standardisierte (!) Regressionskoeffizient beta einer einfachen linearen Regression
ist identisch mit r aus der entsprechenden Pearson-Korrelationsrechnung.

VG

wtf

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11270
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Spaich

Re: Unterschied Regressionskoeffiizient/Korrelationskoeffizi

Beitragvon Spaich » Fr 27. Nov 2015, 15:53

Vielen Dank schon einmal:).
Zu deiner Antwort: "Nur wenn Dich die Verwerfung der Hypothese "In der Grundgesamtheit ist die Steigung = 0,000000..." interessiert."
In meinem Statistikbuch steht: " We also need to know how to check whether there is a statistically significant relationship between y and x, or whether our estimate of b is just a bad estimate of no slope (i.e. a b of zero)." Das heißt doch also, dass ich teste, ob die Steigung einen signifikanten Zusammenhang zwischen meinen Variablen x und y darstellt? Also ist es ja immer "interessant" die Hypothese "In der Grundgesamtheit ist die Steigung = 0,00" zu testen? Ich könnte ja in meinem Senfsamenbeispiel eine Steigung b= 0,96 haben und trotzdem keine Signifikanz für b haben? Trotzdem drückt die Höhe von b aus, wie gut der Zusammenhang ist?
Spaich
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 27. Nov 2015, 13:03
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Unterschied Regressionskoeffiizient/Korrelationskoeffizi

Beitragvon PonderStibbons » Fr 27. Nov 2015, 16:16

Das heißt doch also, dass ich teste, ob die Steigung einen signifikanten Zusammenhang zwischen meinen Variablen x und y darstellt?

Ja, Wie gesagt heißt geht es dabei um die eventuelle Verwerfung der
Nullhypothese "In der Grundgesamtheit ist die Steigung = 0,000000..."

Weichen die Stichproben-Daten "signifikant" von dem ab, was man
völlig per Zufall an Steigung in einer Stichprobe erwarten könnte,
dann entscheidet man, diese Nullhypothese zu verwerfen.

Also ist es ja immer "interessant" die Hypothese "In der Grundgesamtheit ist die Steigung = 0,00" zu testen?

Fragst Du das mich, was "immer" und also unter allen Umständen
interessant sein müsste?

Ich könnte ja in meinem Senfsamenbeispiel eine Steigung b= 0,96 haben und trotzdem keine Signifikanz für b haben?

In dem speziellen Beispiel fast unmöglich, weil der Koeffizient so groß
ist, dass er wohl immer zur Verwerfung der Nullhypothese führen dürfte
(sofern nicht die Stichprobe extrem klein ist), aber im Prinzip ja. Vor
allem, wenn die Stichproben klein sind, man also für die Entscheidung
über die Verwerfung der Nullhypothese nur wenige Daten zur Verfügung
hat, führt das dazu, dass man die Nullyhpothese nicht ablehnen kann.

Trotzdem drückt die Höhe von b aus, wie gut der Zusammenhang ist?

Nur der in der Stichprobe. Den in der Grundgesamtheit kennen wir in der
Regel nicht. Demzufolge wissen wir auch nicht, wieviel von dem beobachteten
Zusammenhang einfach dem Stichprobenzufall zuzuschreiben sein könnte.
Selbst wenn in der Grundgesamtheit b=0 ist, wird man a niemals eine
Stichprobe haben, wo sich das exakt wiederspiegelt, man wird immer ein
b ungleich Nul haben. Je kleiner die Stichprobe ist, desto stärker muss
man damit rechnen, dass markante zufällige Ausschläge vorkommen könnten.


Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11270
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts

Re: Unterschied Regressionskoeffiizient/Korrelationskoeffizi

Beitragvon Spaich » Sa 28. Nov 2015, 19:22

Ok nochmal vielen Dank, mir war das vor allem mit dem Unterschied von b hinsichtlich Stichprobe/Grundgesamtheit nicht klar. Das mit dem "interessant" habe ich nur geschrieben, weil es sich bei deiner ersten Antwort so angehört hat, als ob es nicht besonders wichtig wäre, die Hypothese b = 0 zu testen. Aber passt jetzt alles, danke. Nur wann r = b ist verstehe ich noch nicht so ganz, aber da muss ich mich einfach noch mehr einlesen.
Spaich
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 27. Nov 2015, 13:03
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron