Intervalle mithilfe von Streuungsmaßen festlegen

Univariate Statistik.

Intervalle mithilfe von Streuungsmaßen festlegen

Beitragvon sarahdrs » Do 1. Nov 2018, 11:02

Hallo zusammen,
Statistik liegt schon eine Weile zurück, daher brauche ich bei folgendem Thema Hilfe:

Für ein Projekt habe ich eine Liste von Bahnhöfen und dazugehörige Fahrgastfrequenzen (FGF).

Für ein Bewertungsmodell möchte ich diese Liste in 10 Kategorien unterteilen, die von der FGF abhängen.
Am Ende soll in etwa sowas rauskommen:


    Intervall FGF Stufe
    <5000 0
    5000-10000 1
    10000-15000 2
    15000-20000 3
    20000-25000 4
    25000-30000 5
    30000-40000 6
    40000-50000 7
    50000-65000 8
    >65000 9
Da es einige Ausreißer bei den FGF gibt, kann ich die Anzahl der Bahnhöfe nicht einfach durch 10 teilen.

Ich möchte die Werte bzw Intervalle mithilfe von Streuungsmaßen gleich verteilen.

1) Sind Streuungsmaße hier der richtige Ansatz?
2) Welches Maß sollte ich wählen?

Vielen Dank für Eure Hilfe
Zuletzt geändert von sarahdrs am Do 1. Nov 2018, 15:59, insgesamt 1-mal geändert.
sarahdrs
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 1. Nov 2018, 10:49
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Intervalle mithilfe von Streuungsmaßen festlegen

Beitragvon bele » Do 1. Nov 2018, 15:05

Hallo,

den Satz habe ich noch tnicht verstanden:
sarahdrs hat geschrieben:Da es einige Ausreißer bei den FGF gibt, kann ich die Anzahl der Bahnhöfe nicht einfach durch 5 teilen.


Hinter dem Satz versteckt sich noch eine weitere Anforderung an das Ergebnis, die bisher noch nicht genannt wurde. Kannst Du darauf noch eingehen?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5772
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1354 mal in 1341 Posts

Re: Intervalle mithilfe von Streuungsmaßen festlegen

Beitragvon sarahdrs » Do 1. Nov 2018, 15:56

Hi Bernhard,

damit wollte ich eigentlich nur sagen, dass die FGF nicht gleichverteilt sind.
Ich meinte außerdem "durch 10 teilen", nicht 5, weil ich am Ende 10 Intervalle haben möchte. Hatte mich da verschrieben.

Viele Grüße
sarahdrs
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 1. Nov 2018, 10:49
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Intervalle mithilfe von Streuungsmaßen festlegen

Beitragvon PonderStibbons » Do 1. Nov 2018, 16:17

Für ein Bewertungsmodell möchte ich diese Liste in 10 Kategorien unterteilen, die von der FGF abhängen.

Was ist mit Bewertungsmodell gemeint, wieso muss dazu eine Kategorisierung vorgenommen werden, und wieso gerade 10 Kategorien?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11256
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2471 mal in 2455 Posts

Re: Intervalle mithilfe von Streuungsmaßen festlegen

Beitragvon sarahdrs » Do 1. Nov 2018, 16:31

Die Bahnhöfe sollen anhand verschiedener Kriterien (u.a. FGF) kategorisiert werden. Es gibt 5 Kategorien.
Die Kriterien werden anhand von Stufen gemessen, die immer ein vielfaches von 5 sind. In diesem Fall 0-9 (=10 Stufen).
sarahdrs
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 1. Nov 2018, 10:49
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Intervalle mithilfe von Streuungsmaßen festlegen

Beitragvon PonderStibbons » Do 1. Nov 2018, 18:55

sarahdrs hat geschrieben:Die Bahnhöfe sollen anhand verschiedener Kriterien (u.a. FGF) kategorisiert werden. Es gibt 5 Kategorien.

Wenn es bereits 5 Bahnhof-Kategorien gibt, worin besteht dann die Aufgabe Deiner Analyse?
Die Kriterien werden anhand von Stufen gemessen, die immer ein vielfaches von 5 sind. In diesem Fall 0-9 (=10 Stufen).

Und das wäre dann beliebig wählbar? Ich hätte vermutet, es gibt sachlich begründete Einteilungen.

Mit freundlichen Grüßen

PonderStibons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11256
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2471 mal in 2455 Posts

Re: Intervalle mithilfe von Streuungsmaßen festlegen

Beitragvon sarahdrs » Fr 2. Nov 2018, 10:37

Hi,

mir geht es um die Intervallgrenzen. Ich habe diese mehr oder weniger nach Gefühl festgelegt, davon möchte ich wegkommen.
sarahdrs
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 1. Nov 2018, 10:49
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Intervalle mithilfe von Streuungsmaßen festlegen

Beitragvon PonderStibbons » Fr 2. Nov 2018, 11:11

Man könnte recherchieren, wie sie auf ihre bisherigen Einteilungen gekommen sind https://de.wikipedia.org/wiki/Bahnhofsk ... _Kategorie
Vielleicht gibt es inhaltliche Gründe, zumindest für die Größenordnungen (so ala "ab Fahrgastzahl X müssen unbedingt mit Menschen besetzte Schalter eingereichtet werden"; "Ab Fahrgastzahl Y müssen zusätzliche Züge dort halten"), auch wenn die genauen Grenzen sich anscheinend nur an markanten Zahlenwerten wie "9999" etc. orientieren.

Aus welchem konkreten Grund könnte man denn jetzt andere Grenzwerte brauchen als die bestehenden? Zudem festgelegt auf 10 (statt bisher 6), während die Bahnhöfe nur in 5 Gruppen (statt bisher 7) aufgeteilt werden sollen?

Allerdings habe ich vielleicht Dein Ziel nicht verstanden.

Du schriebst
Ich möchte die Werte bzw Intervalle mithilfe von Streuungsmaßen gleich verteilen.

Da es einige Ausreißer bei den FGF gibt, kann ich die Anzahl der Bahnhöfe nicht einfach durch 10 teilen.

damit wollte ich eigentlich nur sagen, dass die FGF nicht gleichverteilt sind.

Da geht es mal um Fahrgastfrequenzen und mal um Zahl der Bahnhöfe.
Was willst Du nun erreichen?
Eine Einteilung der Bahnhöfe anhand der FGF in 10 Gruppen, deren jede gleich viel Bahnhöfe enthält?
Eine Einteilung in 10 Gruppen, alle mit derselben Intervallbreite hinsichtlich der FGF?
Was anderes?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11256
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2471 mal in 2455 Posts

Re: Intervalle mithilfe von Streuungsmaßen festlegen

Beitragvon sarahdrs » Fr 2. Nov 2018, 11:30

Okay, dann versuche ich es mal an einem Beispiel.

Ich habe Bahnhof A mit 35.000 Fahrgästen pro Tag.

Wenn ich mein bisheriges Modell verwende (siehe erster Beitrag), wird dieser Bahnhof mit Stufe 6 bewertet, weil ich der Stufe 6 das Intervall 30.000-40.000 zugeordnet habe.

Diese Intervalle habe ich willkürlich festgelegt, einfach nach Gefühl und Häufigkeiten ( Bahnhöfe pro Stufe).

Ich hatte die Idee , dass es doch sicherlich statistische Methoden gibt, um die Intervalle festzulegen.

Die einzige Bedingung bei diesen Intervallen besteht darin, dass es am Ende 10 Stufen sein sollen.

Verständlicher?
sarahdrs
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 1. Nov 2018, 10:49
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Intervalle mithilfe von Streuungsmaßen festlegen

Beitragvon PonderStibbons » Fr 2. Nov 2018, 12:10

Diese Intervalle habe ich willkürlich festgelegt, einfach nach Gefühl und Häufigkeiten (Bahnhöfe pro Stufe).

Was heißt "Bahnhöfe pro Stufe" bzw. wie fließt das ein? Es sollten in etwa gleich viele Bahnhöfe in jeder Stufe sein?
In Deinem ersten Posting sieht es danach aus, als wären das einfach nur 5000'er-Schritte.
Verständlicher?

Weiß ich nicht. Ich hatte konkret gefragt, ob es 10 gleich breite Intervalle sein sollen oder 10 Intervalle mit ungefähr
derselben Besetzung. Anscheinend ist das aber egal?
Die einzige Bedingung bei diesen Intervallen besteht darin, dass es am Ende 10 Stufen sein sollen.

Wer hat denn die Bedingung gestellt?

Wenn es außer der 10er-Enteilung keine weitere Bedingung gibt, könnte man sich wie gesagt an den bisherigen Stufen
der Deutschen Bahn orientieren und diese vielleicht weiter aufteilen, um von deren 6 auf 10 zu kommen.

Wenn es denn aber unbedingt statistisch aussehen soll: vielleicht machst Du Dir zunutze, dass die Fahrgastzahlen
vermutlich einer logarithmischen o.ä. Verteilung folgen (zumindest legen das die Intervallgrenzen der deutschen Bahn
nahe). Wenn man dementsprechend e mit ganzen Zahlen potenziert, ist das gerundete Ergebnis für e hoch 1 bis e hoch 13:
3
7
20
55
148
403
1097
2981
8103
22026
59874
162755
442413

Interessanterweise entspricht e hoch 4 in etwa der untersten Grenze der Deutschen Bahn, e hoch 13 liegt
knapp unter den am zweitmeisten frequentierten Bahnhöfen in Deutschland (Münchener und Frankfurter
Haupbahnhof mit je 450.000, nur Hamburg liegt mit 550.000 noch drüber). Weiß aber nicht, ob ein Intervall
wie z.B. 8.100-22.000 goutiert würde, auch wenn es auf glasklarer Mathematik beruht.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11256
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 50
Danke bekommen: 2471 mal in 2455 Posts


Zurück zu Mittelwert, Standardabweichung & Co.

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron