Der Zugriff eines Benutzers auf das Internet läuft meist vom Rechner
des Benutzers über einen sog. Proxy-Server des Providers oder
des Unternehmens in das Internet:
Bei dem Aufruf einer Internet-Adresse (URL) schaut das Programm des
Benutzers (Browser) zunächst im Cache des Benutzers, ob die angeforderte
Seite dort vorhanden ist. Wird die gesuchte Seite dort gefunden, so
wird sie in den Browser geladen und dem Benutzer angezeigt. Der Cache
ist ein individueller Speicher, dessen Größe man sich selber
einstellen kann. Wenn der Cache auf 5 MB Größe eingestellt
ist, reicht diese Größe aus, um einige hundert Internet-Seiten
zu speichern.
Wird nun die gesuchte Seite im Cache des Benutzers nicht gefunden,
so reicht das Programm den Benutzerwunsch zum nächsten Internet-Knotenrechner
weiter. Das ist bei individuell-privater Nutzung der Rechner des
Internet-Providers (T-Online, 1&1, Strato usw.), der dem Benutzer
die Auffahrt auf die Datenautobahn ermöglicht. Beim Internet-Zugang
in einer Firma ist es in der Regel ein besonderer Rechner, der sog.
Proxy-Server.
Der nächste Internet-Knotenrechner bzw. Proxy-Server verfügt
seinerseits wieder über einen Zwischenspeicher, in den jede neu
angeforderte Internet-Seite beim erstmaligen Aufruf geladen wird
(Proxy-Cache). Dadurch soll beim wiederholten Anfordern dieser Seite
vermieden werden, dass die Seite neu aus dem Internet geladen werden
muss. Der
Proxy-Server schaut also bei der Anforderung einer Seite durch einen
Benutzer zuerst nach, ob die Seite schon in seinem Cache gespeichert
ist. Wenn ja, schickt er die Seite direkt an den Benutzer, ohne dass
ein Zugriff in das wirkliche Internet stattgefunden hat. Erst wenn
die Seite im Proxy-Cache nicht gefunden wurde, wird die Suche der
Seite im Internet fortgesetzt und eine direkte Verbindung zum in der
angeforderten URL benannten Rechner aufgebaut. Dieser schickt dann
die Seite über
den Proxy-Server als Zwischenstation an den Benutzer.
Sowohl lokale als auch Proxy-Cachemechanismen führen zu einer
deutlich verringerten Zählung von PageImpressions, besonders bei
Angeboten, die sowohl intensiv (viele Nutzer) als auch lange (lange
durchschnittliche Verbindungszeiten) genutzt werden.
Auch die Ermittlung von Nutzerzahlen ("Visits", "unique users") stößt
auf einige technische Schwierigkeiten: Hinter einem Rechnernamen bzw.
einer Internet-IP-Adresse (z.B. 'spleenux.spiegel.de' oder '194.77.34.12')
können sich mehrere Nutzer mit jeweils eigenen Web-Browsern verbergen.
Das liegt zum einen an der Zuweisung von dynamischen Internet-Adressen,
die bei vielen Internet-Service-Providern (ISP) zum Einsatz kommt.
Die Provider weisen den gerade aktiven Nutzern Adressen aus einem
Pool zu, dadurch können sie mit wenigen Adressen prinzipiell
eine große
Zahl von Nutzern bedienen. Derartige Methoden müssen besonders
große Provider einsetzen. Da diese
Dienste aber ohnehin mit Cache-Servern arbeiten, ist die Ermittlung
von halbwegs korrekten 'Visit'-Zahlen für Nutzer aus dieser
Gruppe nahezu unmöglich, wenn man nicht spezielle Zusatzinformationen
auswertet.
Zum anderen setzen viele Unternehmen mittlerweile aus Sicherheitsgründen
sogenannte 'Firewalls' ein. Diese Firewalls setzen interne IP-Adressen
auf eine einzige externe IP-Adresse um, die bei Zugriffen auf Webserver
auch stets im Log erscheint, auch wenn unterschiedliche Angehörige
des Unternehmens auf das Angebot zugegriffen haben. Kommt beim Unternehmen
noch der Einsatz eines Proxy-Servers hinzu, ergibt sich eine ähnliche
Situation wie bei großen ISP.
Übrigens: Die Benutzeraktivitäten werden an verschiedenen
Stellen protokolliert, so auch im Rechner des Benutzers. Auch wenn
der Cache gelöscht ist, können die in den letzten 30 Tagen
besuchten URLs aufgerufen werden!
Anders verhält es sich auf der
Proxy-Server-Ebene. Die meisten Server sind so eingestellt, dass nur
die "echten" Internet-Zugriffe
festgehalten werden, nicht aber die Zugriffe, die aus dem Cache des
Proxy-Servers bedient wurden.
In einem Proxy-Server-Protokoll ist in der Regel pro Zugriff festgehalten,
wer das war (Kennung des anfordernden Rechners), was angefordert wurde
(Internet-Adresse der angeforderten Seite), wann dies geschah (Datum
und Uhrzeit) und wieviele Bytes dabei übertragen wurden.
Man kann allerdings noch viel mehr protokollieren, z. B. auch, welche
Begriffe man bei der Benutzung einer Suchmaschine eingegeben hat.
Also:
Wenn Sie meine Web-Site bereits besucht haben, vergessen Sie bitte
nicht bei den jeweiligen Seiten die regelmäßige Aktualisierung!
Denn Ihr Browser hat evtl. noch im Cache (Zwischenspeicher) die Version
zum Zeitpunkt Ihres letzten Besuches gespeichert. Laden Sie die aktuelle
Version vom Server!