Wer misst, misst Mist: Warum Logfile-Analyse und Page Tagging so unterschiedliche Zugriffszahlen liefern

Logfile-Analyse vs. Page Tagging (Beispiel)

Digitale Marketing-Kommunikation hat den grossen Vorteil, dass ihre Wirkung präzise messbar ist – so hört man immer. Das ist nicht grundsätzlich falsch, aber auch nicht ganz richtig. Wer sich mit Web Analytics (also der Messung von Website-Zugriffszahlen) beschäftigt weiss, dass es auch hier Messfehler gibt. Dies wird besonders augenfällig, wenn man ein neues Statistik-Tool einführt: In aller Regel weisen die beiden Tools unterschiedliche Zugriffszahlen für dieselbe Website aus.

Besonders gross ist die Abweichung, wenn die beiden Tools unterschiedliche Messmethoden benutzen. Wer von der Logfile-Analyse (wie sie beispielsweise WebTrends oder AWstats ermöglichen) auf das Page Tagging (die Methode von Google Analytics oder Piwik) umsteigt, wird in aller Regel deutlich tiefere Zahlen für Page Views, Sessions und Users erhalten. Das kann im Einzelfall auf Konfigurationsfehler zurückzuführen sein, in der Regel ist es aber prinzipbedingt. Die Logfile-Analyse und das Page Tagging haben beide ihre Eigenheiten, welche die Zugriffszahlen sowohl nach oben als auch nach unten verfälschen können. Aber in der Gesamtheit wird Google Analytics tiefere Werte ausweisen als ein Tool, das nur Logfiles auswertet.

Logfile-Analyse: zuverlässig, aber naiv

Die Logfile-Analyse basiert auf dem Logfile, in dem der Web Server laufend protokolliert, wann er welche Datei an welche IP-Adresse ausgeliefert hat. Dieses Protokoll ist sehr zuverlässig; lediglich wenn Webseiten auf Proxy-Servern oder in Browser Caches zwischengespeichert werden, bekommt der Web Server nicht alle Zugriffe mit.

Andererseits ist das Logfile aber auch sehr naiv, weil es jegliche Requests verzeichnet, auch wenn sie für die Statistik nicht relevant sind. So findet man darin auch Zugriffe von nicht-menschlichen Besuchern (z.B. Suchmaschinen-Spidern, Spam Bots) sowie Zugriffe auf Files, welche weder Webpages noch Download-Dokumente sind (z.B. RSS Feeds, XML-Schnittstellen). Je nach eingesetztem Web Analytics Tool kann man solche Zugriffe zwar ausfiltern, aber dafür braucht man ein gutes technisches Verständnis.

Page Tagging: leistungsfähig, aber empfindlich

Das Page Tagging basiert auf einem JavaScript, das jeden Seitenaufruf an den Statistik-Server meldet, sobald es im Web-Browser ausgeführt wird. Dieses Verfahren kann auch zwischengespeicherte Webseiten zuverlässig auswerten. Es versagt dafür komplett, wenn der Client das JavaScript nicht ausführt – und das kann aus vielerlei Gründen passieren:

  • Der Benutzer hat in seinem Web Browser JavaScript deaktiviert.
  • Die Anfrage kommt von einem Mobilgerät mit fehlender oder mangelhafter JavaScript-Unterstützung.
  • Die Anfrage stammt von einem Bot, der kein JavaScript interpretiert (was auf die Mehrheit der Bots zutrifft).
  • Das JavaScript für die Statistik wird aufgrund von Konflikten mit anderen Skripten nicht korrekt ausgeführt.
  • Das JavaScript wird überhaupt nicht ausgeführt, weil der Besucher die Seite verlässt, bevor jene vollständig geladen wurde.
  • Das JavaScript wird zwar ausgeführt, aber weil der Statistik-Server nicht (bzw. nicht genügend schnell) antwortet, wird der Zugriff nicht protokolliert.

 

Fazit

Wie die Grafik in diesem Artikel zeigt, können die Unterschiede zwischen den beiden Messmethoden unter Umständen gravierend sein. Auf die Frage, welche Zahlen denn nun stimmen, gibt es eine einfache Antwort: Beide sind falsch, und die Wahrheit liegt irgendwo in der Mitte. Das Logfile zählt viele Zugriffe, die uns gar nicht interessieren, weil sie nicht von menschlichen Besuchern stammen oder keine normalen Webpages repräsentieren. Beim Page Tagging dagegen werden tendenziell zu tiefe Zahlen ausgewiesen, weil es zahlreiche Situationen gibt, bei denen das JavaScript einen Zugriff nicht melden kann.

Wenn es um Web Analytics geht, sollte man generell die absoluten Zahlen mit Vorsicht geniessen und eher mit relativen Werten operieren. Wie hat sich die Anzahl der Sessions über die Zeit verändert? Wie verteilen sich die Zugriffe prozentual auf die verschiedenen Bereiche der Website? Solche Fragen lassen sich unabhängig von der Messmethode zuverlässig beantworten und sind für das Marketing mindestens so interessant.

Leave a Reply