9 Logfile-Analyse der Website - ifib
9 Logfile-Analyse der Website - ifib
9 Logfile-Analyse der Website - ifib
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
9.3.1 Probleme bei <strong>der</strong> <strong>Analyse</strong><br />
Web-<strong>Logfile</strong>-<strong>Analyse</strong>n werden durch unterschiedliche Faktoren bzgl. ihrer Aussagekraft und<br />
Genauigkeit eingeschränkt, die <strong>der</strong> Vollständigkeit halber an dieser Stelle aufgeführt werden<br />
sollen.<br />
Das Hauptproblem 12 <strong>der</strong> <strong>Logfile</strong>-<strong>Analyse</strong> bei Webserver-<strong>Logfile</strong>s ist die Tatsache, dass HTTP ein<br />
zustandsloses Protokoll ist. Das heißt, jede Anfrage eines Clients nach einer Webseite (o<strong>der</strong><br />
je<strong>der</strong> einzelnen darin vorkommenden Grafik usw.) ist für den Webserver eine eigenständige<br />
Aktion. Klickt sich <strong>der</strong> Benutzer durch eine <strong>Website</strong>, hat <strong>der</strong> Webserver keinerlei Kenntnis, dass<br />
<strong>der</strong> Benutzer gerade schon eine Seite abgerufen hat.<br />
Dynamisch vergebene IP-Adressen stellen für die <strong>Logfile</strong>-<strong>Analyse</strong> ein weiteres Problem dar. 13<br />
Wegen des begrenzten Vorrats an IP-Adressen vergeben Online-Dienste wie z.B. AOL o<strong>der</strong> T-<br />
Online wie auch an<strong>der</strong>e Internet-Service-Provi<strong>der</strong> ihre IP-Adressen dynamisch. Das führt zu<br />
zwei unterschiedlichen Effekten:<br />
1. Mit wenigen Adressen kann ein Online-Anbieter eine große Zahl von Nutzern bedienen.<br />
Gerade sehr aktiven Benutzern wird oft ein spezieller Pool von Adressen zugewiesen.<br />
Der Effekt ist, dass im <strong>Logfile</strong> nur wenige Adressen zu finden sind, hinter denen sich<br />
jedoch eine Vielzahl von Benutzern verbergen kann (so kann es auch zu deutlichen<br />
Differenzen zwischen Seitenaufrufen und Besucherzahlen kommen).<br />
2. Derselbe Benutzer kann zu unterschiedlichen Zeiten unterschiedliche IP-Adressen<br />
zugewiesen bekommen. Im <strong>Logfile</strong> erscheinen dann zwei Adressen, hinter denen sich<br />
jedoch nur ein Benutzer verbirgt.<br />
Diese Verfälschung des <strong>Logfile</strong>s ist damit insofern problematisch, da eine Ermittlung von<br />
genauen „Besuchszahlen“ (visits) und eine Identifikation einzelner Benutzer sehr schwierig<br />
wird.<br />
Eine weitere Schwierigkeit stellen die methodischen Probleme bei <strong>der</strong> <strong>Logfile</strong>-<strong>Analyse</strong> dar.<br />
Methodisch lässt sich beispielsweise nicht in Erfahrung bringen, welche Benutzer-<br />
Transaktionen im <strong>Logfile</strong> nicht aufgezeichnet werden, weil sie zuvor durch Caching<br />
Mechanismen (Browser-Cache o<strong>der</strong> Proxy-Cache) herausgefiltert werden und daher nicht bis<br />
zum Webserver gelangen.<br />
Weiterhin spielen Firewalls bei <strong>Logfile</strong>-<strong>Analyse</strong>n unter Umständen eine problematische Rolle,<br />
weil sie die IP-Adresse <strong>der</strong> einzelnen Computer im Firmennetz auf eine einheitliche anonyme<br />
IP-Adresse verkürzen. Einzelne <strong>Website</strong>besucher lassen sich somit nicht mehr unterscheiden.<br />
Die Proxy- sowie die Firewall-Problematik können sich beim Einsatz bei<strong>der</strong> Techniken<br />
überlagern. Die Folge sind ungenaue und verzerrte Aussagen bzgl. <strong>der</strong> Besucherzahlen.<br />
12<br />
Quelle: Wikipedia, http://de.wikipedia.org<br />
13<br />
Simone Fühles-Ubach (2001): „Web-Statistik - Potenziale und Grenzen“, Manuskript eines Vortrages im Rahmen<br />
<strong>der</strong> Informatica feminale an <strong>der</strong> Universität Bremen, 2001.<br />
124