Welche möglichen Verfahren?

Fragen, die sich auf kein spezielles Verfahren beziehen.

Welche möglichen Verfahren?

Beitragvon Brobold » So 19. Jan 2014, 20:42

Hallo liebe Forums-Mitglieder,

ich benötige Hilfe bzw. Anregungen für eine Teiluntersuchung meiner wissenschaftliche Arbeit. Ich möchte gern vereinfacht untersuchen ob es einen Zusammenhang zwischen dem Eigentümer-Anteil "öffentlich oder privat" eines Anbieters und den Endkunden-Strompreisen gibt. Die erste Variable ist also ein "prozentualer Anteil" im Intervall [0%,100%] und eine zugehörige zweite Variable "Jahresendpreis Stromtarif" z.B. von [200€,400€] (fiktive Angabe). Ich habe nun eine große Menge dieser Wertepaare, wobei der Eigentümer-Anteil zu etwa 2/3 aller Werte mit genau 0% oder 100% (also entweder komplett öffentlich oder komplett privat) ausgeprägt ist. Deshalb erscheint mir eine lineare Korrelationsuntersuchung irgendwie abwegig. Aus der grafischen Darstellung kann ich leider auf kein Verfahren schließen, da sowohl bei 0% als auch bei 100% fast das gesamte Intervall des Jahresendpreises [200€,400€] vorkommt und der Mittelwert des Preises bei beiden Ausprägungen fast identisch ist. Ich vermute daher zwar keinen Zusammenhang anhand meiner Daten, aber möchte das statistisch sauber überprüfen. Das sollte idealerweise mit Excel möglich sein.

Welche Verfahren bieten sich hier überhaupt an? Bin ich bei der Korrelationsuntersuchung zweier metrischer Variablen richtig? Welche Koeffizienten oder Tests sind möglich/passend? Was muss ich bei der Analyse beachten? Sollte ich die übrigen wenigen Anteil-Ausprägungen gruppieren ( z.B. [0%; 0-25%; 25-50%; etc.])?

Über jegliche Vorschläge/Hinweise oder konkret gezielte Literaturempfehlungen bin ich sehr dankbar.

Vielen Dank für eure Hilfe im Voraus

VG
Brobold
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 19. Jan 2014, 14:14
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Welche möglichen Verfahren?

Beitragvon Brobold » Mo 20. Jan 2014, 14:43

Ich möchte natürlich nicht, dass mir jemand die ganze Arbeit abnimmt. Als Laie der Statistik wäre jedoch eine Richtung schon sehr hilfreich, alles darüber hinaus phänomenal.

Testet man einen solchen Zusammenhang über Korrelationskoeffizienten oder stellt man den Zusammenhang als Hypothese auf und testet mit Hilfe eines Hypothesentests?
Brobold
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 19. Jan 2014, 14:14
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Welche möglichen Verfahren?

Beitragvon PonderStibbons » Mo 20. Jan 2014, 15:16

Man könnte es mit dem Spearman-Rangkorrelationskoeffizient versuchen.
Ob der sehr beeinträchtigt wird, wenn extrem viele Verbundwerte vorliegen,
weiß ich allerdings nicht.

In Unkenntnis des Kontexts und der Stichprobengröße weiß ich nicht, ob und
welch eine Kategorisierung sinnvoll möglich wäre, aber in etwa das Schema
"gar nicht/gering/überwiegend/vollständig in öffentlicher Hand" und dann eine
einfaktorielle Varianzanalyse oder ein Kruskal-Wallis H-Test wäre nicht von
vornherein abwegig.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11270
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Brobold

Re: Welche möglichen Verfahren?

Beitragvon Brobold » Di 21. Jan 2014, 13:36

Hallo P.,

vielen Dank für deine Antwort.
1. Welche Informationen benötigt man um den Kontext besser zu verstehen? Zum Stichprobenumfang: Werte von n>300 Unternehmen bei knapp über 1000 Stromversorgern auf dem Markt sollten signifikant sein.

2. Bei Spearman habe ich gelesen, dass man eine Korrekturformel bei häufigen Bindungen nutzen soll. Aber bei über 70% Bindungen der Anteils-Variable kann man ja von keiner Gleichverteilung der Ränge mehr ausgehen, oder? Ich habe gelesen, dass es bei Kendalls Tau auch eine Alternative bei vielen Bindungen gibt. Besteht darin auch eine Möglichkeit meines Problems?

3. Mein Problem liegt auch in der Abschätzung einer möglichen Verteilung der Anteilsvariable um eventuell andere (auch nichtstandardisierte) Signifikanztests zu nutzen.

4. Deine vorgeschlagene Kategorisierung ist schon sinnvoll in dem Kontext. Zum Verständnis für mich: Als Voraussetzung für die einfaktorielle Varianzanalyse müssen die Fehlerkomponenten normalverteilt sein, Homoskedastizität muss gegeben sein und die Faktorstufen müssen unabhängig voneinander sein. Bei den Jahrespreisen kann auch von einer Normalverteilung ausgegangen werden. Wie sieht das dann mit den k-Stufen aus? Müssen die auch normalverteilt sein? "gar nicht" und "vollständig" würden dann etwa 2/3 ausmachen. Wie teste ich ob Homoskedastizität gegeben ist?

Mit freundlichen Grüßen
Brobold
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 19. Jan 2014, 14:14
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Welche möglichen Verfahren?

Beitragvon Brobold » Di 21. Jan 2014, 16:00

Zur Ergänzung:
Aus dieser Übersicht http://www.methodenberatung.uzh.ch/datenanalyse/unterschiede/zentral.html habe ich mir mal erarbeitet wieso einfaktorielle Varianzanalyse und Kruskal Wallis in Frage käme.
Sollte die abhängige Variable normalverteilt sein, ist die einfaktorielle Varianzanalyse dann Kruskal Wallis vorzuziehen?
Sehe ich das richtig, dass ich also die einzelnen Anteilsgruppen (z.B. "vollständig öffentlich", "nicht öffentlich", etc.) als verschiedene Stichproben betrachte und damit auf Unterschiede der zentralen Tendenzen (Mittelwerte) der einzelnen Gruppen untersuche. Der Formel entnehme ich, dass es dabei unkritisch ist, wenn die einzelnen Stufen verschiedene Stichprobenumfänge haben. Ist das so korrekt?

Wenn ich die Rangkorrelation nutze, welchen Mehrwert kann ich dann aus der Untersuchung der zentralen Tendenz erwarten?
Brobold
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 19. Jan 2014, 14:14
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Welche möglichen Verfahren?

Beitragvon PonderStibbons » Di 21. Jan 2014, 16:07

Ich habe gelesen, dass es bei Kendalls Tau auch eine Alternative bei vielen Bindungen gibt. Besteht darin auch eine Möglichkeit meines Problems?

Ja. Ich kenne den nur zu wenig um sagen zu können,
ob er mit sehr vielen Stufen zurechtkommt.
3. Mein Problem liegt auch in der Abschätzung einer möglichen Verteilung der Anteilsvariable um eventuell andere (auch nichtstandardisierte) Signifikanztests zu nutzen.

Ich verstehe nicht den ersten Teil, und leider weiß
ich auch nicht, was mit einem nichtstandardisierten
Signifikanztest gemeint sein könnte.
4. Deine vorgeschlagene Kategorisierung ist schon sinnvoll in dem Kontext. Zum Verständnis für mich: Als Voraussetzung für die einfaktorielle Varianzanalyse müssen die Fehlerkomponenten normalverteilt sein,

Das spielt bei n > 300 keine nennenswerte Rolle mehr (zentraler Grenzwertsatz).
Außer, die Verteilungen in den Gruppen sind extrem (z.B. extrem schief so dass
z.B. ein Mittelwert nicht mehr sehr repräsentativ ist, oder z.B. die Gruppen zeigen
stark gegenläufige Schiefe), was den Test zwar nicht verzerrt, aber die Interpretation
belasten könnte.
Homoskedastizität muss gegeben sein

Zumindest bei ungleichen Gruppengrößen. Ist Homoskedaszität nicht gegeben,
kann man die korrigierten Varianten (nach Welch oder Brown-Forsythe)
verwenden.
Wie teste ich ob Homoskedastizität gegeben ist?

Levene Test.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11270
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2476 mal in 2460 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Brobold


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste