Integración de tecnología webcrawler en sistemas de gestión de fuentes de información: Desarrollo de la aplicación Cumulus2 = Webcrawler technology, for management systems information sources. Integration and develop in Cumulus2 software

Blázquez-Ochando, Manuel and Serrano-Mascaraque, Esmeralda Integración de tecnología webcrawler en sistemas de gestión de fuentes de información: Desarrollo de la aplicación Cumulus2 = Webcrawler technology, for management systems information sources. Integration and develop in Cumulus2 software., 2011 . In X Conferencia iberoamericana en sistemas, cibernética e informática CISCI, Orlando, 19-22 julio 2011. [Conference paper]

[img]
Preview
Text
cisci2011-manuel-blazquez-ochando.pdf - Accepted version

Download (880kB) | Preview

English abstract

The objective of the research is to develop a specialized tool in the management of sources of information on science and technology, using analysis techniques parser, able to improve recovery capabilities contained in the unit or information center and documentation, as well as solving the current problem of the high level of obsolescence scientific literature. This research line has been based on the Cumulus program, which installed an integrated webcrawler acting program in pre-cataloging for retrieving as much information as possible, about an information source. To do this, there are methodological and quantitative tests to contrast and repeat the results. Finally, we present a web directory model for proper representation and visualization of the contents that had been indexed, based on the principles of web usability and accessibility.

Spanish abstract

El objetivo de la investigación es elaborar una herramienta especializada en la gestión de fuentes de información en ciencia y tecnología que, haciendo uso de las técnicas de de análisis parser, sea capaz de mejorar las capacidades de recuperación de contenidos en la unidad o centro de información y documentación; así como solucionar el actual problema que supone el alto nivel de obsolescencia de la literatura científica. En esta línea se ha tomado como base el programa Cumulus, al cual le ha sido integrado un programa webcrawler que actuará en fase de pre-catalogación, recuperando la mayor cantidad de información posible, correctamente identificada. Para ello, se presentan pruebas metodológicas y cuantitativas que permiten contrastar y repetir los resultados obtenidos. Finalmente, como resultado de la gestión y edición semi-automática de las fuentes de información, se presenta un modelo de directorio web para la correcta representación y visualización de los contenidos, atendiendo a los principios de usabilidad y accesibilidad web.

Item type: Conference paper
Keywords: Fuentes de información, Information sources, ciencia y tecnología, STM, Science and Technology, recuperación de información, Information retrieval, usabilidad y accesibilidad web, webcrawler, automatización, herramientas bibliográficas, cibermetría, PHP DOM, Usability, Accessibility, Bibliographic tolos, Automation.
Subjects: I. Information treatment for information services
L. Information technology and library technology > LJ. Software.
L. Information technology and library technology > LS. Search engines.
Depositing user: Dr. Manuel Blázquez Ochando
Date deposited: 29 May 2013 09:33
Last modified: 02 Oct 2014 12:25
URI: http://hdl.handle.net/10760/19105

References

"SEEK" links will first look for possible matches inside E-LIS and query Google Scholar if no results are found.

BURTON, R. E. y R. W. KEBLER. 1960. The Half-Life of some Scientific and Technical Literatures. American Documentation. 11, pp. 18-22.

BLÁZQUEZ OCHANDO, M. 2010. Gestión de fuentes de información en ciencia y tecnología: desarrollo del programa CUMULUS. En: VII Seminario Hispano-Mexicano de Biblioteconomía y Documentación. México DF: CUIB.

Client URL Library. 2011.

http://php.net/manual/es/book.curl.php

Document Object Model. 2011.

http://php.net/manual/es/book.dom.php

SimpleXMLElement class. 2011

http://www.php.net/manual/en/class.simplexmlelement.php

LI, Y. y J. YANG. 2009. A novel method to extract informative blocks from web pages. En: International Joint Conference on Artificial Intelligence (JCAI). Haikou, pp.536-539.

BLÁZQUEZ OCHANDO, M. y E. SERRANO MASCARAQUE. 2011. SRW Schematic Reduction Website.

http://www.mblazquez.es/documents/articulo-tecnica-srw.html

BOK KIM, Y. 2010. Accessibility and Usability of User-centric Web Interaction with a Unified-Ubiquitous Name-based Directory Service. Journal World Wide Web. 13(1-2), pp.107-108.


Actions (login required)

Edit Item Edit Item