GESAR: Software configurable para generación de estadísticas de un servidor EZproxy

Ortiz Ancona, Dante, Ballesteros Estrada, Silvia, Gama Mora, Mario, Cedillo Pérez, Alfredo and Ibarra Contreras, Rafael GESAR: Software configurable para generación de estadísticas de un servidor EZproxy., 2012 [Preprint]

[thumbnail of GESAR.pdf]
Preview
PDF
GESAR.pdf

Download (469kB) | Preview

English abstract

Purpose: Presents a software system statistics generator, with configurable reports for decision making in the digital collections development, through the processing of log files generated by an EZproxy server. Design / methodology / approach: This case study was written after implementing the software GESAR into the DGB-UNAM remote access service. The followed procedure was: process the log files generated by an EZproxy server and store the resulted information in three relationships within a relational database containing institutional catalogs (electronic resources providers, users, communities, campi, among others). In the present case, 159 statistical reports on the use of electronic resources were defined, with the option to define a larger amount. Then, through a graphical interface statistical reports were displayed in HTML and Microsoft Excel format, what makes possible to filter the information in different ways, making the number of displayed reports virtually uncountable. Findings: Although GESAR was designed for an EZproxy server, it can easily be adapted to any website. By analyzing statistical reports, it was found what kind of users accessed what resources, on what date and time, as well as the physical locations from where access was performed. This analysis allowed us to discover certain anomalies in the use of electronic resources by some users. Originality / value: GESAR incorporates two new features not provided by any other similar tool: a) it generates reports based on users’ needs. b) utilization of a database with institutional catalogs to generate reports. The usage data allow to visualize who, where, when and what resources were consulted. The analyzed data universe was 263 million access records and 171,000 users. Keywords / topics: web analytics, transaction log analysis, web log analysis, log file analysis, log processing, statistics web sites, log analysis, collections management, library users, online databases. Publication Type: Case Study

Spanish abstract

Propósito: Presentar un sistema de software generador de estadísticas, con informes configurables, para toma de decisiones en el desarrollo de acervos digitales, por medio del procesamiento de archivos de registro de acceso generados por un servidor EZproxy. Diseño/metodología/enfoque: El presente caso de estudio se conformó al aplicar el GESAR al servicio de acceso remoto de DGB-UNAM . El procedimiento fue: procesar los archivos de registro de acceso generados por un servidor EZproxy y almacenar la información en 3 relaciones de una base de datos relacional que contiene catálogos institucionales (proveedores de recursos electrónicos, usuarios, comunidades, campus, etc.). En este caso, se definieron 159 informes estadísticos sobre el uso de los recursos electrónicos con la opción de poder definir una cantidad mayor. Mediante una interfaz gráfica se despliegan los informes estadísticos en formato Html y Microsoft Excel, lo cual posibilita filtrar la información de diferentes formas, haciendo que el número de informes desplegados sea prácticamente incontable. Hallazgos: Aunque GESAR se definió para un servidor Ezproxy, puede adaptarse fácilmente a cualquier portal WEB. Mediante el análisis de los informes estadísticos se descubrió qué usuarios accedieron a qué recursos, en qué fecha y hora, así como las ubicaciones físicas desde donde realizaron el acceso. Lo anterior permitió detectar anomalías, en el uso de recursos electrónicos, por parte de algunos usuarios. Originalidad/valor: Se incorporan dos funcionalidades nuevas no provistas por ninguna herramienta de este tipo: a). generar informes en función de las necesidades. b). Utilización de una base de datos con catálogos institucionales para generación de informes. Los datos de uso permiten visualizar quiénes, de dónde, cuándo y qué recursos fueron consultados. El universo de datos analizados fué de 263 millones de registros de acceso y 171 mil usuarios.

Item type: Preprint
Keywords: web analytics, transaction log analysis, web log analysis, log file analysis, log processing, statistics web sites, log analysis, collections management, library users, online databases, análisis de registro de transacciones, análisis web, registro de archivos, procesamiento de registros, bases de datos en línea.
Subjects: L. Information technology and library technology > LK. Software methodologies and engineering.
Depositing user: rafael ibarra
Date deposited: 29 Nov 2012
Last modified: 02 Oct 2014 12:24
URI: http://hdl.handle.net/10760/18103

References

Asunka, Stephen., Chae, Hui., Hughes, Brian., & Natriello, Gary. (2009). Understanding Academic Information Seeking Habits through Analysis of Web Server Log Files: The Case of the Teachers College Library Website. The Journal of Academic Librarianship, 35 (1), p.33-45. doi: 10.1016/j.acalib.2008.10.019

Awstats. (2012). Free advanced log file analyzer for web, ftp or mail statistics. Retrieved from AWStats Official Web Site http://awstats.sourceforge.net/ [Accessed: 27 Nov 2012].

Awstats (Version 7.0) [Computer software]. All Countries: GNU GPL.

Coombs, Karen. (2005). Lessons learned from analyzing library database usage data. Library Hi Tech, 23 (4), p.598-609. doi:10.1108/07378830510636373

Das, Resul., & Turkoglu, Ibrahim. (2009). Creating meaningful data from web logs for improving the impressiveness of a website by using path analysis method. Expert Systems with Applications, 36 (3), p.6635–6644. doi:10.1016/j.eswa.2008.08.067

Ezproxy. (2012). Sistemas y servicios de administración. Retrieved from OCLC Online http://www.oclc.org/americalatina/es/ezproxy/default.htm [Accessed: 27 Nov 2012].

EZproxy (Version 5.4) [Computer software]. All Countries: OCLC.

Marek, Kate. (2011). Using Web Analytics in the Library. Library Technology Reports, 47 (5), p.5-10.

Ortiz, Dante. (Abril 2006). BiDi UNAM amplía su acceso. EXLIBRIS, 3(2), p. 2. Distrito Federal, México: DGB-UNAM.

Sawmill. (2012). Universal log file analysis and reporting. Retrieved from Flowefire Online http://www.sawmill.net/index.html [Accessed: 19 Sep 2012].

Sawmill professional (Version 7.2.18) [Computer software]. Santa Cruz, CA, USA: Flowerfire.

Webalizer. (2012). Home of the Webalizer, a fast, free web server log analysis program. Retrieved from Home of The Webalizer http://www.webalizer.org/

Webalizer (Version 2.23.05) [Computer software]. All Countries: GNU GPL.

Wiggins, Andrea. (2007). Data-Driven Design: Using Web Analytics to Validate Heuristics. Bulletin of the American Society for Information Science and Technology, 33 (5), p.20-24. doi:10.1002/bult.2007.1720330508

Yun, Gi., Ford, Jay., Hawkins, Robert., Pingree, Suzzanne., McTavish, Fiona., Gustafson, David.,...Berhe Haile. (2006). On the validity of client-side vs server-side web log data analysis. Internet Research, 16 (5), p.537-552. doi:10.1108/10662240610711003


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item