Makro- und Mikro-Mining am Beispiel von Webserver Logfiles
(2005) Makro- und Mikro-Mining am Beispiel von Webserver Logfiles. In Proceedings Knowledge eXtended, Jülich (Germany).
Full text available as: |
Abstract
[German abstract]
Webserver Logfiles sind eine hochinteressante Informationsquelle zur Untersuchung der Zugänglichkeit, Sichtbarkeit und Verlinkung von beliebigen Webinhalten. Dieser Beitrag stellt zwei neuere Ansätze der Logfile Analyse bzw. des Web Mining vor (Makro-Mining & Mikro-Mining). Der weitverbreiteten Methode der Makro-Analyse, die hauptsächlich allgemeine Zugriffszahlen aggregiert (z. B. Anzahl der Downloads eines Dokuments), wird die bislang weniger bekannte Methode der Mikro-Analyse gegenübergestellt. Die Mikro-Analyse konzentriert sich auf schmale Segmente des Logfiles, die bis auf Transaktionen einzelner User zurückgehen. Beide Analysemethoden werden anhand eines Beispiels erklärt. Weiterhin wird versucht neue Einsatzbereiche der beiden Web-Mining Verfahren zu identifizieren und Formen der kombinierten Nutzung der beiden Methoden zu skizzieren.
[English abstract]
Webserver log files are a very interesting data source for analysing the accessibility, visibility and interlinking of any web content. This paper proposes two recent log file or web mining approaches (macro-mining & micro-mining of webserver log files). We try to bring together the popular method called macro analysis which aggregates common server request counts (e.g. number of downloads of a certain document) with the micro analysis method which is less known in log analysis. The micro-mining approach focuses on segmented log files which can be drilled down to transactions of single users. Both analysis methods will be explained by an example. Furthermore we try to identify new use cases and try to sketch ways of combined analysis for both web mining methods.
| Keywords: | Logfile Analysis, Webserver Logfiles, Webmining, Macro-Analysis, Micro-Analysis |
|---|---|
| Subjects: | B. Information use and sociology of information. > BZ. None of these, but in this section. C. Users, literacy and reading. > CZ. None of these, but in this section. L. Information technology and library technology. > LJ. Software. I. Information treatment for information services > II. Filtering. |
| ID Code: | 4645 |
| Deposited By: | Mayr, Philipp |
| Deposited On: | 14 September 2005 |
| Alternative Locations: | http://www.ib.hu-berlin.de/~mayr/arbeiten/mayr_nancoz_kx05.pdf |
| All fields: | Show all fields |
Archive Staff Only: edit this record

