Frage bezüglich Interpretation des Streudiagrammes

Bivariate Korrelation, partielle Korrelation und Rangkorrelation.

Frage bezüglich Interpretation des Streudiagrammes

Beitragvon steyr » So 4. Feb 2024, 20:39

Liebes Forum,

als Neuling und Laie im Bereich von Statistik, wollte ich euch um Hilfe oder einfach eure Meinung bitten. In derAbbildung ist ein Streudiagramm zweier Datensätze zu sehen ( y-achse: Das Volumen eines Indexes und auf der x-achse: ein eigener Indikator). Daraus ergab sich eine lineare Korrelation von etwa 0.55. Wenn ich den Graph so ansehe, scheint es mir so, als wären da noch weitere korrelationen/informationen versteckt, da dieser so ein eigenartiges Muster aufweist.
Meine Frage wäre jetzt an euch, was ihr da seht, wie ihr das Interpretiert oder weiter verfahren würdet, um noch weitere Informationen herauszudestilieren.

Wäre villeicht eine clusteranalyse angebracht? Aber ich weiß nicht, ob irgendein clusteralgo da mehr rausholen kann.

Auf eure Meinungen würde ich mich sehr freuen.

Liebe Grüße
steyr
Da das bild nicht hochgeladen werden konnte, weil scheinbar irgendein Kontingent voll war, musste ich es über einen upload service uploaden. Danke für euer Verständnis!

[url]
https://ibb.co/jGv6Hcs[/url]
steyr
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: So 4. Feb 2024, 20:28
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Frage bezüglich Interpretation des Streudiagrammes

Beitragvon bele » So 4. Feb 2024, 21:20

Ja, das ist sicher ein Muster und kein Zufall. Es scheint zwei Symmetrieachsen zu geben, eine von links unten nach Rente oben und eine etwa rechtwinklig dazu. Eine Hauptachsenanalyse (PCA) könnte helfen, diese genau zu beschreiben. Ob das inhaltlich weiter führt und interpretierbar wird, weiß ich auch nicht.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5782
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1358 mal in 1345 Posts

Re: Frage bezüglich Interpretation des Streudiagrammes

Beitragvon steyr » Mo 5. Feb 2024, 09:39

JA, das hilft mir sehr weiter, dankeschön!

Also du meinst das wahrscheinlich so:

https://ibb.co/tsgrRYy


Zu deinem Vorschlag einer PCA.. Ich dachte eine PCA wäre deutlich mehr auf die lieneare Korrelation zweier variablen abhängig? Würde in diesem Fall bei einer PCA dann theoretisch zwei Hauptkomponenten exrtrahierrt werden? Nämlich diese um Linie B und diese um Linie A ?

Eigenlich würde ja nur diese um Linie A wirklich was bringen, wegen breiterer Varianz. Wenn Linie B dan noch hinzu ngenommen würde, würde diese ja redundante Informationen enthalten, wenn ich das mit der PCA richtig verstehe.
steyr
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: So 4. Feb 2024, 20:28
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Frage bezüglich Interpretation des Streudiagrammes

Beitragvon bele » Mo 5. Feb 2024, 14:34

Unten links hast Du A und B rechtwinklig gezeichnet. Das entspricht der PCA.

Deine Punkte streuen am meisten um Achse A. Deshalb stellt sich die Frage, was an einem Punkt ausmacht, ob er ein hohes A hat oder nicht. Korreliert irgendwas mit dem A Wert, bei dem es soviel Streuung gibt?

Die mit A nicht erklärte Varianz steckt in B. Anscheinend darf der Betrag von B umso größer werden, je größer der Betrag von A ist.

Die PCA erlaubt Dir einen Blick auf Deine Daten aus einem anderen Winkel. Ob sich aus dem anderen Blickwinkel dann sachlich relevante Aussagen ergeben weiß man vorher nicht. Das ist Exploration.

Aber so wie Du die Linien A und B gezogen hast ist klar, dass Du dasselbe gesehen hast wie ich. Was wir beide gesehen haben fasst die PCA in konkrete Zahlen, mit denen man dann Korrelationen und Regressionen rechnen kann.

Anscheinend darf der Betrag von B umso größer werden, je größer der Betrag von A ist. Siehst Du das? Dann versuch doch mal, diese einfache Aussage mit Deinen Originalachsen zu beschreiben.

Verschiedene Cluster sehe ich jedenfalls nicht.

LG, Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5782
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1358 mal in 1345 Posts

folgende User möchten sich bei bele bedanken:
steyr

Re: Frage bezüglich Interpretation des Streudiagrammes

Beitragvon steyr » Di 6. Feb 2024, 08:23

vorab ein Dankeschön für deine analytische Unterstützung. Das hilft mir bereits sehr!

Um A ist die Streuung am meisten ausgeprägt, das sehe ich auch so. Möglicherweise gäbe es da sogar mehrere Variablen, welche mit A korrelieren könnten. Die Frage welche mir da aber kommt, ist, wie ich weitere Werte überprüfe, die mit A korrelieren könnten? Müsste ich dazu eine Hauptkomp. Analyse machen, dann die Achse A auswählen und diese dann mit einer weiteren Variable X in einem scatterplot wie in dem Bild hier unten darstellen? erscheint mir gerade zumindest am naheliegendsten.

Auf deinen Vorschlag hin, diese Zusammehänge in Bezug auf die Originalachsen zu beschreiben, kam folgendes Bild dabei raus (s. Link).
Es haben sich 5 Bereiche herauskristallisiert:

Bereich 1: P ist leicht negativ, V ist negativ
Bereich 2: P positiv, V ist leicht positiv
Bereich 3: P ist leicht positiv, V ist positiv
Bereich 4: P ist negativ, V ist leicht negativ
Bereich 5: P und V korrelieren pos. miteinander

https://ibb.co/bJq0Lq5

Die zweite Frage wäre, wie geht es von hier aus weiter? Augenscheinlich sagen alle diese Bereiche eindeutig etwas über die Targetvariable Y etwas aus. könnte ich diese Bereichseingrenzung nicht schon dazu heranziehen, um eine Art händisches Clustering für die Targetvariable Y zu erstellen?

Vielen Dank
steyr
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: So 4. Feb 2024, 20:28
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Frage bezüglich Interpretation des Streudiagrammes

Beitragvon bele » Di 6. Feb 2024, 09:10

Hallo,

steyr hat geschrieben:Analyse machen, dann die Achse A auswählen und diese dann mit einer weiteren Variable X in einem scatterplot wie in dem Bild hier unten darstellen? erscheint mir gerade zumindest am naheliegendsten.


Klingt gut.

Auf deinen Vorschlag hin, diese Zusammehänge in Bezug auf die Originalachsen zu beschreiben, kam folgendes Bild dabei raus (s. Link).


Was Du da als P und V markiert hast verstehe ich nicht. Sieht aus wie die Achsen des Histogramms unten rechts. Die verschiedenen Bereiche sehe ich nicht, denn für mich ist das ein geformter Klumpen Daten, keine mehreren Klumpen. Deshalb weiß ich auch nicht, wie Du da Cluster finden willst, sei es händisch oder mittels einer Clusteranalyse. Ich weiß auch nicht, welche Variable Du hier als Targetvariable beschreibst, denn zur Natur der Daten und was das Ziel einer Analyse wäre hast Du nichts geschrieben, ja jetzt sogar die Achsenbeschriftungen nicht mehr im Bild, die wenig mehr gesagt haben als dass es hier um eine Wirtschaftswissenschaftliche Arbeit gehen dürfte.

Ich glaube, ich bin damit auch am Ende dessen, was ich antworten kann. Du hast nach einer Meinung zu einem Muster in einem Streudiagramm gefragt und mehr als diese eine Idee habe ich dazu nicht.

Viele Grüße,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5782
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1358 mal in 1345 Posts

Re: Frage bezüglich Interpretation des Streudiagrammes

Beitragvon steyr » Di 6. Feb 2024, 13:16

Dankeschön Bernhard,

dann werde ich das mit der PCA mal ausprobieren.

Mit P und V wollte ich lediglich die Achsenbeschriftung abkürzen. P steht für den Preis (x-achse), V für das Volumen (y-achse) eines Assets.

Die Sache ist die, dass diese 4 oder 5 Bereiche ganz typische Verlaufsformen des Assets wiederspiegeln. Das Target wäre einerseits die Bewegungsrichtung des Preises, sowie dessen Betrag, also die größe der Bewegung.
steyr
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: So 4. Feb 2024, 20:28
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Frage bezüglich Interpretation des Streudiagrammes

Beitragvon bele » Di 6. Feb 2024, 17:35

Also nach meinem bisschen Schulunterricht damals führt eine Erhöhung des Preises zu weniger Umsatz/Handelsvolumen und eine Verringerung des Preises zu weniger Umsatz/Handelsvolumen. Wenn das ein linearer Zusammenhang wäre, dann wäre dieser Zusammenhang durch die Linie A gekennzeichnet. Die Abweichung von der Linearität ist Achse/Hauptkomponente B. Große Schritte im Preis/Umsatz-Verhältnis sind aber nicht linear, sondern der Betrag von B wird immer größer, je schneller sich die Preis/Volumen Schritte gestalten.

Irgendwo in dieser Richtung würde ich die wirtschaftswissenschaftliche Erklärung vermuten, aber mein Wissen darüber ist auf Abitur-Niveau stehen geblieben.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5782
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1358 mal in 1345 Posts

Re: Frage bezüglich Interpretation des Streudiagrammes

Beitragvon steyr » Mi 7. Feb 2024, 14:26

Ja genau in die Richtung geht das.
Ich werde mal sehen, was sich damit machen lässt. vielen Dank nochmal an dieser Stelle. Mir hat dieser Austausch sehr dabei geholfen, wie man solche Diagramme betrachtet und gleichzeitig mit einer PCA transformiert.
steyr
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: So 4. Feb 2024, 20:28
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste