Das Dateiformat PDF im Web – eine statistische Erhebung

Mayr, Philipp Das Dateiformat PDF im Web – eine statistische Erhebung. Information Wissenschaft und Praxis, 2002, vol. 53, n. 8. [Journal article (Unpaginated)]

[img]
Preview
PDF
nfd_PDF_im_Web.pdf

Download (173kB) | Preview

English abstract

The statistical survey „PDF im Web“ deals with the quantitative evaluation of the file format Portable Document Format (PDF) on the World Wide Web. The main interest of this paper is to illustrate and demonstrate a method which allows a numerical assessment of this file format on the internet. Main focus of the analysis is the calculation of the percentage of the PDF documents to certain queries and the average document size of the queried PDF files. The survey bases on search engine hit lists from Google which were generated by structured queries. The demonstrated method will be exemplary tested by a sample of 50 queries. The evaluation compares the findings for both publication languages German and English and for different complex queries.

German abstract

Die statistische Erhebung „PDF im Web“ befaßt sich mit der quantitativen Evaluation des Dateiformats Portable Document Format (PDF) im World Wide Web. Das Hauptinteresse dieser Arbeit besteht darin, ein Verfahren zu erläutern und zu demonstrieren, mit dem eine zahlenmäßige Einschätzung dieses Dateiformats im Internet möglich wird. Hauptaugenmerk der Analyse ist die Errechnung des Anteils der PDF-Dokumente zu bestimmten Suchanfragen sowie die durchschnittliche Dokumentgröße der recherchierten PDF-Dateien. Die Erhebung basiert auf Trefferlisten des Suchmaschinenbetreiber Google, die über strukturierte Suchanfragen generiert werden. Das vorgestellte Verfahren wird anhand einer Stichprobe von 50 Anfragen exemplarisch getestet. Im Rahmen der Auswertung werden die Ergebnisse bzgl. der beiden Publikationssprachen Deutsch und Englisch sowie unterschiedlich komplexer Anfragen miteinander verglichen.

Item type: Journal article (Unpaginated)
Keywords: Webometrics, Internet Research, Evaluation
Subjects: B. Information use and sociology of information
H. Information sources, supports, channels.
Depositing user: Philipp Mayr
Date deposited: 11 Jan 2005
Last modified: 02 Oct 2014 11:59
URI: http://hdl.handle.net/10760/5756

References

Brin, Sergey; Page, Lawrence: The anatomy of a large-scale hypertextual Web search engine. In: Computer Networks and ISDN Systems, 30(1–7):107–117, 1998.

Buder, Marianne; Rehfeld , Werner; Seeger, Thomas: Grundlagen der praktischen Information und Dokumentation: ein Handbuch zur Einführung in die fachliche Informationsarbeit. München, 1991.

Fuhr, Norbert: Information Retrieval. 1998 URL: http://ls6-www.informatik.uni-dortmund.de/ir/teaching/lectures/ir_ws00-01/irskall.pdf Stand 20.04.02

Kind, Joachim: Online-Dienste. In Grundlagen der praktischen Information und Dokumentation. München, 1991.

Knorz, Gerhard: Indexieren, Klassieren, Extrahieren. In Grundlagen der praktischen Information und Dokumentation. München, 1991.

Ohst, Daniel: Dateiformate für das elektronische Publizieren. Berlin, 1998

URL: http://dochost.rz.hu-berlin.de/buecher/ohst-daniel/HTML/ Stand 20.04.02

Page, Lawrence; Brin, Sergey: The pagerank citation ranking. Bringing order to the web. Technical report, 1998.

Portable Document Format Reference Manual. Adobe Systems Incorporated

URL: http://www.adobe.com

Schöch, Volker: Die Suchmaschine Google. Berlin 2001 URL: http://www.tau-web.de/home/interests/uni/google.pdf Stand 20.04.02

Staud, Josef: Statistische Information. In: Grundlagen der praktischen Information und Dokumentation. München, 1991.


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item