Vergleich von zwei Prozententwicklungen über mehrere Jahre

Vergleich von zwei Prozententwicklungen über mehrere Jahre

Beitragvon schind » Mo 6. Aug 2012, 20:59

Hi,
bin neu hier im Forum und stehe gleich vor einem großen Problem, bei dem ich nicht weiß, welchen Test ich anwenden muss. Mein statistisches Wissen beschränkt sich auf ein Semester an der Uni, d.h. die Grundlagen sollte ich einigermaßen beherrschen.

Ich habe Informationen über die Daten von jährlichen Webcrawls (dabei werden gewisse Bereiche des www gescannt und unter anderem die Dateitypen aller gefundenen Dateien gespeichert) aus den Jahren 2005 bis 2010.

Mein Ziel ist es, herauszufinden, ob es möglich ist, aus der Verteilung eines Subsets dieser Daten auf das gesamte Web zu schließen. Dafür ziehe ich aus den Daten 2 unabhängige Stichproben. Nun stelle ich für Stichprobe 1 eine Kurve dar, zu wie vielen Prozenten pro Jahr diese z.B. aus PDF-Dateien besteht.
Anschließend wird diese Kurve auch für die zweite Stichprobe erstellt. Als Nullhypothese stelle ich auf, dass die beiden Kurven ident sind (mit gewisser Fehlerwahrscheinlichkeit).

Welchen Test kann/muss ich zum Testen der Hypothese verwenden, und wie gehe ich am besten vor?
Meine Idee war, einfach die Prozentwerte der einzelnen Jahre zu vergleichen (Kurve 1 2005 == Kurve 2 2005 && ...), allerdings weiß ich nicht, ob dies korrekt ist, und auch nicht, welcher Test hier zulässig ist, da ich nur über Verteilungen gelernt habe, die normalverteilt sind, wovon man ja hier nicht ausgehen kann (oder?).

Ich hoffe, mir kann jemand weiterhelfen. Habe schon lange im Internet gesucht, aber leider keine Lösung gefunden.

lg
schind
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mo 6. Aug 2012, 20:47
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Vergleich von zwei Prozententwicklungen über mehrere Jah

Beitragvon schind » Mo 13. Aug 2012, 13:36

Kann mir niemand helfen?

Soll ich vielleicht noch etwas präzisieren?
schind
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mo 6. Aug 2012, 20:47
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Nichtparametrische Tests

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste