Wie kann man "diesen" Kurvenverlauf numerisch beschreiben?

Distanzmaße, Diskriminanzanalyse, graphische Analysen etc.

Wie kann man "diesen" Kurvenverlauf numerisch beschreiben?

Beitragvon joebe » Di 2. Aug 2016, 03:55

Ich betreibe eine kleine Suchmaschine und habe ausgewertet wie oft Nutzer auf das 1. Suchergebnis klicken, wie oft auf das 2., etc. Das Ergebnis sieht so aus:
Bild

Es ist also ein klarer Trend erkennbar (wie ein Halbkreis - hohe Werte am Anfang und Ende, niedrige in der Mitte).

Meine Fragen

1. Gibt es irgendein statistisches Maß um den Verlauf bzw. die Stärke der Kurve auszudrücken, ähnlich einer Korrelation?

2. Wie kann man die Signifikanz ausrechnen? Angenommen, es wurden 10.000 Ergebnisseiten angezeigt und im Durchschnitt erhielt die 1. Position 7000 Klicks, die 2. Position 5900 Klicks, die 3. Position 5200 Klicks... wie Signifikant ist das Ergebnis, dass die ersten und letzten Suchergebnisse deutlich häufiger angeklickt werden als die mittleren?
joebe
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 18. Apr 2013, 17:26
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wie kann man "diesen" Kurvenverlauf numerisch beschreibe

Beitragvon jogeha » Di 2. Aug 2016, 16:56

Hallo joebe
1. Ich vermute Du meinst "die Kurve zu charakterisieren", dh. festzustellen welcher Kurventyp am besten passt. Eine simple Zahl wie die Korrelation kann da nicht weiterhelfen
2. Signifikanz- was soll signifikant sein? wenn etwa die Hypothese
H0: alle Positionen haben a priori die gleiche Wahrscheinlichkeit geklickt zu werden, also p(1)=p(2)= .... p(10)
, geprüft wird dann ist ein chi-quadrat-Anpassungstest sinnvoll. Damit werden die erwarteten (=aus der Hypothese) Klicks mit den beobachteten (=aus den Daten) Klicks verglichen. Allerdings sollte diese Hypothese sachlich begründet sein;
jogeha
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 22. Jan 2012, 19:48
Danke gegeben: 0
Danke bekommen: 1 mal in 1 Post

Re: Wie kann man "diesen" Kurvenverlauf numerisch beschreibe

Beitragvon joebe » Mi 3. Aug 2016, 03:25

jogeha hat geschrieben:Hallo joebe
1. Ich vermute Du meinst "die Kurve zu charakterisieren", dh. festzustellen welcher Kurventyp am besten passt.


Jein. Bei den folgenden Daten könntest die Darstellung zwar als "Gerade" charakterisieren, aber trotzdem könntest du noch zusätzlich die lineare Korrelation angeben (z.b. 0.7), wobei eine Korrelation von 1 einer perfekten Geraden entsprechen würde.

Bild

Hier Beispiele von nicht-linearen Korrelationen
Bild
Genau so etwas würde ich mir auch für meine Daten erhoffen, denn es gibt wohl auch nicht lineare Korrelationen (Abb. 6 entspricht ja in etwa meinen Daten)

Darum die Frage
1a. Wie nennt man die Art von Kurve die ich im ursprünglichen Post zeige? (wie "charakterisiert" man sie?)
1b. Wie kann man diese Art der nicht-linearen Korrelation berechnen?


jogeha hat geschrieben:Hallo joebe
2. Signifikanz- was soll signifikant sein?


Nun, wenn die Daten lediglich auf 100 Beobachtungen beruhen, dann könnte es Zufall sein, dass es eine Kurve ist. Wenn die Daten auf 10.000 Beobachtungen beruhen, dann ist es mit hoher Wahrscheinlichkeit kein Zufall. Wie kann ich dies in einer Zahl quantizifieren?
joebe
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Do 18. Apr 2013, 17:26
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wie kann man "diesen" Kurvenverlauf numerisch beschreibe

Beitragvon maf_ » Mi 9. Nov 2016, 15:31

Hallo joebe,

Wenn es dir nur darum geht es nach linearen und nicht linearen Zusammenhängen zu klassifizieren, dann ist das definitiv nicht-linear. Lineare Zusammenhänge (Referenz dabei auf deine Bilder) haben gleiche Steigung in eine Richtung. Da sich bei deiner Funktion die Steigung ändert, ist es nicht-linear.

Um deine zweite Größe zu bestimmen, wäre es sinnvoll zu wissen, worum es genau geht. Alternativ kannst du auch deinen Erwartungswert bestimmen und dann das entsprechende Ergebnis nach der Entfernung dazu klassifizieren.

Gruß,
maf_
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Mo 17. Okt 2016, 11:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wie kann man "diesen" Kurvenverlauf numerisch beschreibe

Beitragvon bele » Mi 9. Nov 2016, 16:26

Was hälst Du davon: Du berechnest eine Regression wie folgt:



sei der zufällige Fehler / die Residuen, der y-Achsenabschnitt. berechnet der Computer im Rahmen einer linearen Regression gemeinsam mit je einer dazugehörigen Signifikanz. Der quadratische Term gibt dem Modell im Gegensatz zu einer Geraden die Chance, rechts und links nach oben abzubiegen. Wenn signifikant und positiv wird, dann wäre das der Beleg, dass das System durch eine Gerade unzureichend beschrieben ist und eine nach unten gebogene Form richtig ist.
Natürlich könnte man bei ausreichenden Gesamtzahlen auch noch einen kubischen und einen Term dazu nehmen, aber erstmal wäre quadratisch doch ein Anfang, oder?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5748
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 15
Danke bekommen: 1343 mal in 1330 Posts


Zurück zu weitere Verfahren

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron