[2007-06-13] Big Martin is watching you
Fingerübungen allenthalben. Diesmal ein .php script, das mir visualisiert, wie du, geneigter Konsument, dich auf meiner Seite bewegst. (s.u.)
Dein aktuelles Surfverhalten.
arua.ch im Rauschen der Spinnen
Mit dem Tool kann ich die Zahl und Art der NutzerInnen auf arua.ch detailliert aufschlüsseln. bzw. in Menschen und Automaten unterteilen. Werte ich z.B. die 48 Stunden vor dem 19.Juni 8.30 Uhr aus, zeigt sich folgendes Bild: Es gab innnert diesen zwei Tagen 123 verschiedene Sessionen. Ich definiere diese als Gruppe von Zugriffen mit weniger als 10 Minuten zwischen zwei aufeinanderfolgenden Zugriffen. Also 123 Sessionen total. Davon sind 93 (75.6%) auf Crawler, Spiders und Bots zurückzuführen. Der Rest teilt sich in Menschen (26 / 24.1%) und undefinierte (4 / 0.3 %)
Bei der Zahl der Zugriffe, den Aufrufen einzelner Seiten innerhalb einer Session ist die Übermacht der Automaten dann nicht mehr so gross, da nicht-automatische Nutzer eher auf der Seite herum stöbern. Die Totalanzahl von 335 Zugriffen verteilt sich so auf 144 / 34.1% durch Automaten, 187 / 55.8% durch Menschen und 4 / 0.1% durch nicht-definierte Nutzer.
Grob sind also bei einer Webseite mit ca.60 Sessions pro Tag drei Viertel aller Sessions und noch die Hälfte aller Zugriffe im Zusammenhang mit Suchmaschinen zu sehen. :-P
Es ist anzunehmen, dass dieses Grundrauschen eine Funktion des Seitenumfangs einer Webseite ist.
robots.txt
Entscheidender Faktor des Grundrauschens ist, ob ein Webmeister spiders, bots und crawlers auf seiner Seite duldet oder nicht. Das definiert durch eine Datei namens robots.txt, in seinem www-verzeichnis anlegt und die zum Beispiel die zwei Zeilen
# Ganze Site für alle Robots sperren
User-agent: *
Disallow: / enthält.