Hallo auch,
ich kann mir nicht vorstellen, wie du auf Ebenen der Einzelseiten keinen Zusammenhang findest. Bist du sicher, dass du da keinen Zusammenhang findest? Wie groß sind denn die Korrelationen? Denn das was du da untersuchst ist eigentlich trivial. Es MUSS einen positiven Zusammenhang zwischen Aufrufhäufigkeit und Veränderungshäufigkeit geben: Nicht jeder, der eine Seite aufruft, ändert auch etwas, ABER
jeder der etwas auf der Seite verändert hat, MUSS die Seite aufgerufen haben! Daher MUSST du auch einen Zusammenhang finden.
Oder verstehe ich hier gerade etwas komplett falsch?!
Dann habe ich den Mittelwert dieser Koeffizienten berechnet, aber irgendwo dann gelesen, dass das keine zuverlässige Operation ist.
Das hast du richtig gelesen, da die Korrelation nicht metrisch skaliert sind. Nicht metrisch heißt: Der Unterschied zwischen r = .5 und .4 ist nicht derselbe wie zwischen r = .8 und .9. Das heißt, du darfst kein Minus rechnen und nicht geteilt nehmen (so wie man das aber bei einem Mittelwert macht). Aber, wie der Bernhard bereits richtig gesagt hatte, kann man die Korrelationskoeffizienten nach Fisher "Fisher'z-"transformieren. Diese Werte sind wieder metrisch.
Daraufhin habe ich von allen Forumsseiten die Gegenüberstellung von Aufrufhäufigkeit und Änderungshäufigkeit in ein Diagramm gesteckt und davon den Korrelationskoeffizienten berechnet und siehe da, es ist ein linearer Zusammenhang vorhanden!
Du hast sie worein gepackt? In ein Diagramm? Diagramm = Abbildung. Meinst du einfach damit, dass du schlichtweg alle Daten zusammengefügt hast? Also jetzt nur noch eine Spalte "Aufrufhäufigkeit" und eine Spalte "Veränderung"? Klingt so, als wärst du also an den Zusammenhang zwischen alle Seiten interessiert, richtig? Dann hast du es auf jeden Fall richtig gemacht.
Wenn ein Forum viele aktive Teilnehmer hat, dann werden viele Seiten aufgerufen und es werden viele Seiten geändert. Handelt es sich aber um ein verschlafenes Forum, in dem nix passiert, dann gibt es in diesem Forum weniger Aufrufe und wenige Änderungen.
Klingt irgendie banal, oder? Erklärt aber den Zusammenhang in Deiner "Alles zusammengeschmissen"-Analyse.
Hm...
Positiver Zusammenhang bedeuten inhaltlich:
Je höher die Seitenaufrufe, desto häufiger werden die Seiten verändert.ABER es bedeutet auch:
Je niedriger die Seitenaufrufe, desto seltener werden die Seiten verändert.Wenn das vorliegt, haben wir einen positiven Zusammenhang. Es zählt die allgemeine Richtung: Die Richtung, in der die Werte der einen Variablen gehen, ist
dieselbe, wie die der anderen Variable.
Ich glaube damit ist aber die Erklärung von Bernhard hinfällig, oder?
Ich denke viel eher, dass es daran liegt, dass der Aspekt, dass der Seitenaufruf als Bedingung für die Seitenänderung dient, über die Menge an Daten schlichtweg deutlicher hervortritt (siehe das, was ich oben geschrieben habe).
Okay, danke für die Antwort. Würde denn eine Standardiserung etwas bringen, um die verschiedenen Verteilungen der einzelnen Foren überhaupt miteinander vergleichen zu können?
Was genau willst du denn da standardisieren? Inhaltlich ist ein Seitenaufruf für Forum A genau so ein Seitenaufruf wie für Forum B. Eine Standardisierung ergibt nur Sinn, wenn die
Maßeinheiten zweier Variablen unterschiedlich sind! Ein Beispiel: Ein Mathetest hat als Note 1 bis 6. Ein anderer Mathetest hat die Noten 1 bis 15. Du wirst hier die Werte der einzelnen Probanden nicht ohne Weiteres vergleichenkönnen, daher würde man hier standardisieren. Die Maßeinheiten bei dir sind aber für alle Foren doch wahrscheinlich dieselbe oder misst du die Häufigkeiten unterschiedlich?

Wenn du denn unbedingt die Korrelationen miteinander vergleichen möchtest, dann google mal nach "Korrelationen vergleichen". Wenn du davon ausgehst, dass der User, der für den Seitenaufruf von Forum A auch für den Seitenaufruf von Forum B verantwortlich ist, dann hast du eine abhängige Stichprobe: "Korrelationen vergleichen abhängige Daten". Wenn du glaubst die Seitenaufrufe von Forum A und B werden von unterschiedlichen Usern verursacht, dann hast du eine unabhängige Stichprobe: "Korrelationen vergleichen unabhängige Daten". Mit etwas Glück musst du da nichts per Hand rechnen, sondern findest Seiten, auf denen du deine Parameter nur eingeben musst und fertig ist der Lachs.
Kleine Anmerkung noch: Es ist eigentlich nur sinnvoll Korrelationen miteinander zu vergleichen, die signifikant von Null verschieden sind.
Viele Grüße