Entwicklung und Test einer logfilebasierten Metrik zur Analyse von Website Entries am Beispiel einer akademischen Universitäts-Website

English abstract

Web log files record user transactions on web servers and offer due to their extent, their properties and potential an excellent investigation field for contemporary information and online behaviour studies. The empirical, explorative investigation from the fields Web Mining, Webometrics and Logfile Analysis introduces new aspects and analysis possibilities for web log data. The study develops and tests a quantitative, non-reactive measure method (log metric "Web Entry Factors"), that allows statements about the accessibility and visibility of highly frequented entry points of a web site. The three distinguishable web navigation types "navigation about search engines", "navigation about backlinks" and "direct navigation" are focused. The study integrates a classification scheme for web pages as well as the prominent external parameter PageRank from the today most important search engine Google. Investigation subject are Web log files of two complete age-groups (in 2000 and 2002) of the web server of the Institute for Library Science at the Humboldt University to Berlin (http://www.ib.hu-berlin.de/), as well as the 100 most frequently used entry pages of this academic university web site. This publication goes back to the master thesis in Library and Information Science (Master of Arts, M.A.) at Humboldt-Universität in Berlin.

German abstract

Web Logfiles protokollieren Benutzertransaktionen auf Webservern und bieten aufgrund ihres Umfangs, ihrer Eigenschaften und Potenziale ein ausgezeichnetes Untersuchungsfeld für heutige Informations- und Onlineverhaltensstudien. Die empirische, explorative Untersuchung aus den Bereichen Web Mining, Webometrics und Logfileanalyse stellt neue Gesichtspunkte und Analysemöglichkeiten für Logdaten vor. Zu diesem Zweck entwickelt und testet die Arbeit ein quantitatives, nicht-reaktives Messverfahren (Logmetrik „Web Entry Faktoren“), das anhand von einfachen Web Logdaten, Aussagen über die Zugänglichkeit und Sichtbarkeit von hochfrequentierten Einstiegspunkten einer Website ermöglicht. Im Mittelpunkt stehen die drei unterscheidbaren Navigationsarten im Web „Navigation über Suchmaschinen“, „Navigation über Backlinks“ und „direkte Navigation“. Die Untersuchung integriert ein Klassifikationsschema für Webseiten sowie den prominenten externen Parameter PageRank der heute wichtigsten Suchmaschine Google. Untersuchungsgegenstand sind Web Logfiles zweier kompletter Jahrgänge (2000 und 2002) des Webservers des Instituts für Bibliothekswissenschaft an der Humboldt-Universität zu Berlin (http://www.ib.hu-berlin.de/), sowie die 100 am häufigsten genutzten Einstiegsseiten dieser akademischen Universitäts-Website. Diese Veröffentlichung geht zurück auf eine Magister-Arbeit im Magisterstudiengang Bibliothekswissenschaft Master of Arts (M.A.) an der Humboldt-Universität zu Berlin (Library and Information Science).

Item type: Thesis (UNSPECIFIED)
Keywords: Log File Analysis, Webometrics, Navigation, Evaluation, Metrics
Subjects: A. Theoretical and general aspects of libraries and information.
B. Information use and sociology of information
Depositing user: Philipp Mayr
Date deposited: 11 Jan 2005
Last modified: 02 Oct 2014 11:59
URI: http://hdl.handle.net/10760/5754


