Wissen, was gut ist. Studieren in Chemnitz.

Webzugriffe ermitteln

Natürlich interessiert es einen Webautoren, wie oft seine Seiten gelesen werden. Technisch gesehen sind das die Zahlen der Anforderungen dieser Dokumente von unserem Server. Nicht erfassbar sind Anforderungen, die bereits durch lokale Proxy-Cache-Server (beim Dienstanbieter des Lesers z.B.) erfüllt werden. Außerdem lässt sich natürlich kaum ermitteln, ob die Seite auch wirklich gelesen oder nur überblättert wurde...

Die tägliche und monatliche Auswertung der Logfiles verrät die am häufigsten angeforderten Dokumente (TOP 150).

webstat

Die Seitenabrufe werden aus den Logdateien der zentralen Webserver www.tu-chemnitz.de und www-user.tu-chemnitz.de in eine Datenbank übernommen, Dabei werden lokale Zugriffe (TU Chemnitz = *.tu-chemnitz.de), "nahe" Zugriffe (Deutschland = *.de) und andere Zugriffe einzeln aufgeschlüsselt. Desweiteren werden die Zugriffe im aktuellen Monat, in den vorigen Monaten des aktuellen Jahres und die noch früheren Zugriffe einzeln gezählt.

Erfasst sind die Zugriffe seit 1.1.1997. In jeder Nacht werden die Zugriffszahlen des Tages für jedes Dokument in der Datenbasis aktualisiert. D.h. die Zugriffe des aktuellen Tages sind erst am Tag darauf sichtbar!

Der Zugang zur Statistik erfolgt über das CGI-Skript /cgi-bin/webstat oder über eine PHP-Funktion im jeweiligen Dokument.

Einsatzmöglichkeiten des CGI-Programmes:

  1. Einbindung als Verweis in das Dokument
    Damit lässt sich "per Klick" die Zugriffsstatistik des jeweiligen Dokumentes ermitteln.
    Beispiel:
    Die <a href="http://www.tu-chemnitz.de/cgi-bin/webstat">Zugriffszahlen</a> dieses Dokumentes.

    Die Zugriffszahlen dieses Dokumentes.

  2. Zugriffsstatistik anderer Dokumente
    Bei Angabe des Dokumentenpfades eines anderen Dokumentes wird dessen Zugriffsstatistik angezeigt.
    Beispiel:
    Zugriffe auf die <a href="http://www.tu-chemnitz.de/cgi-bin/webstat/index.html">TU Homepage</a>.

    Zugriffe auf die TU Homepage.

    Man kann auch die Statistiken mehrerer Dokumente (maximal 100) abrufen, indem der Anfang des Dokumentenpfades mit einem angehangenem * angegeben wird. Dabei werden die Dokumente mit den meisten Zugriffen zuerst angezeigt.
    Beispiel:
    Zugriffe auf die <a href="http://www.tu-chemnitz.de/cgi-bin/webstat/www-index/such*">lokale WWW-Suche</a>

    Zugriffe auf die lokale WWW-Suche

    Beispiel zur Verwendung als Formular:
    <form action="http://www.tu-chemnitz.de/cgi-bin/webstat" method="get">
    Zugriffe auf: <input name="doc" value="/index.html" />
    <input type="submit" value="Statistik" /></form>
    Zugriffe auf:
  3. Weitere Optionen
    Werden die Statistiken mehrere Dokumente abgefragt, kann die Sortierreihenfolge angegeben werden:
    Beispiel:
    Die <a href="http://www.tu-chemnitz.de/cgi-bin/webstat/cgi-bin/*?sort=monatgesamt">TOP 100 /cgi-bin-Programme dieses Monats</a>.

    Die TOP 100 /cgi-bin-Programme dieses Monats

    Angabe hinter sort= Sortierung nach
    keine Angabe gesamten Zugriffen (Standard-Sortierung)
    gesamtlokal gesamten lokalen Zugriffen
    gesamtde gesamten Zugriffen aus Deutschland
    gesamtwelt gesamten Zugriffen aus aller Welt
    jahrgesamt gesamten Zugriffen in diesem Jahr
    jahrlokal lokalen Zugriffen in diesem Jahr
    jahrde Zugriffen aus Deutschland in diesem Jahr
    jahrwelt Zugriffen aus aller Welt in diesem Jahr
    monatgesamt gesamten Zugriffen in diesem Monat
    monatlokal lokalen Zugriffen in diesem Monat
    monatde Zugriffen aus Deutschland in diesem Monat
    monatwelt Zugriffen aus aller Welt in diesem Monat

Einsatzmöglichkeiten als PHP-Funktion:

Ist das Dokument ein PHP-Skript, kann die Statistik auch gleich im Dokument angezeigt werden. Beispiel:

<?php include('php/webstat.inc'); 
      $res = webstat($_SERVER['PHP_SELF']);
      printf ("Gesamtzugriffe: %s, davon TU Chemnitz: %s<br />",
           $res[0]['gesamt'],
           $res[0]['gesamtlokal']);
?>

Ergebnis: Gesamtzugriffe: 30917, davon TU Chemnitz: 9289

Der Funktion webstat wird der URL-Pfad (oder ein Muster mit *) des abzufragenden Dokuments übergeben. Als Ergebnis erhält man ein Feld von Feldern. Das erste Feld (Index 0) enthält die Zugriffe aller gefundenen Dokumente. Die Gesamt-Zugriffszahl erhält man mit dem Index 'gesamt', einzelne Zugriffszahlen mit Indizes lt. obiger Tabelle.

Wurde der URL-Pfad als Muster angegeben (mit *), erhält man die Top 100 der zutreffenden Dokumente als weitere Einträge im Ergebnisfeld:

<?php include_once('php/webstat.inc'); 
      $res = webstat('/urz/www/*');
      printf("%s: %d Dokument(e), Gesamtzugriffe: %s, davon TU Chemnitz: %s, DE: %s<br />\n",
        $res[0]['url'],
        $res[0]['count'],
        $res[0]['gesamt'],
        $res[0]['gesamtlokal'],
        $res[0]['gesamtde']);

     # Ausgabe der Top 5:
      $max = $res[0]['count'] < 5 ? $res[0]['count'] : 5;
      if ($max > 1) {
          print "<b>Top $max Dokumente:</b><br />\n";
          for ($i = 1; $i <= $max; $i++) {
              if ($res[$i]['url'])
                  print $res[$i]['url'] . ': ' . $res[$i]['gesamt'] . "<br />\n";
          }
      }
?>
Ergebnis: /urz/www/*: 100 Dokument(e), Gesamtzugriffe: 9680882, davon TU Chemnitz: 7414757, DE: 578940
Top 5 Dokumente:
/urz/www/urlx.php: 5784322
/urz/www/mozilla/1.1/mailnews-start-de.html: 344349
/urz/www/firefox/3.html: 254263
/urz/www/url.php: 232953
/urz/www/: 220268