La información medioambiental en España: recursos y acceso a la información pública: análisis webmétrico (2ª parte)

Blázquez-Ochando, Manuel and Rámos-Simón , L. Fernando and Arquero-Avilés, Rosario and Cobo-Serrano, Silvia La información medioambiental en España: recursos y acceso a la información pública: análisis webmétrico (2ª parte). Revista Interamericana de Bibliotecología, 2014, vol. 37, n. 1, pp. 13-34. [Journal article (Paginated)]

[img]
Preview
Text
RIB 37-1 artículo 1 Final 04-02.pdf - Published version
Available under License Creative Commons Attribution Non-commercial.

Download (1MB) | Preview

English abstract

The goal of the research is the webometric analysis of the main Spanish central Government sites concerning environmental issues. In this line, topography, structure, interaction, and meta-description of the contents are studied so that results can be compared with the Mexican environment websites. To achieve this, the Mbot webcrawler tool - which analyzes the site extent and dimension, the website ranking, the meta-descriptors ratio by page, the frequency analysis of the description terms and some statistical tables to estimate the sample - has been used in this academic. Because of results, several recommendations to improve the search engines indexing and remove bad practices that limit the access to public information as well as the information retrieval have been developed. It can be outlined the interplay between the Spanish environment Websites and its European counterpart, the number of unpopular information sources, syndication channels that enable public environmental information monitoring and, lastly, the ideal range of frequency of occurrence for the terms used in the meta-descriptions.

Spanish abstract

La meta de la investigación es el análisis webmétrico de los principales sitios de la administración central española especializada en medio ambiente, con el objetivo de estudiar la topografía, estructura, interrelación y metadescripciones de los contenidos, pudiendo posteriormente realizar su comparación con la web mexicana de la misma área de conocimiento. Para lograrlo, se ha utilizado la herramienta webcrawler Mbot, que analiza la extensión y dimensiones de la web, los rankings de sitios web con más páginas, el ratio de meta-descriptores por página, el análisis de frecuencia de los términos empleados en las descripciones y una serie de tablas estadísticas que permiten valorar la muestra. A raíz de los resultados obtenidos, se han elaborado varias recomendaciones dirigidas a mejorar la capacidad de indexación de los motores de búsqueda y suprimir malas prácticas que debilitan la capacidad de recuperación y acceso a la información pública. Entre las conclusiones, destaca la importante interrelación entre la Web española de medio ambiente y su homóloga europea, descubriendo fuentes de información poco conocidas, la recopilación de canales de sindicación que permita el seguimiento de la información pública en medio ambiente y el descubrimiento del rango ideal de frecuencias de aparición de los términos usados en las metadescripciones.

Item type: Journal article (Paginated)
Keywords: Webmetría, Mbot, webcrawler, medio ambiente, administración pública, información del sector público, acceso a la información, topografía web, información medioambiental, España, México; Webometrics, Mbot, webcrawler, environment, public administration, public sector information, information access, website topography, environmental information, Spain, Mexico.
Subjects: A. Theoretical and general aspects of libraries and information.
Depositing user: Luis Carlos Toro Tamayo
Date deposited: 27 Feb 2014 17:55
Last modified: 02 Oct 2014 12:30
URI: http://hdl.handle.net/10760/22636

References

BERGMARK, D.; LAGOZE, C.; SBITYAKOV, A. (2002). Focused crawls, tunneling, and digital libraries. En: Proceedings of the Sixth European Conference on Digital Libraries, (Rome, September 16–18), 91–106. Disponible en: http://link.springer.com/content/pdf/10.1007%2F3- 540-45747-X.pdf [Consulta: 21 de octubre de 2013].

BERNERS-LEE, T. (1995). Hypertext Markup Language - 2.0, RFC 1866, Network Working Group. Disponible en: http://tools.ietf.org/html/rfc1866 [Consulta: 21 de octubre de 2013].

BLÁZQUEZ OCHANDO, M.; SERRANO MASCARAQUE, E. (2011). Análisis de la web y usabilidad: prueba de funcionamiento de Mbot webcrawler. En: X Congreso del Capítulo español de ISKO (La Coruña, 30 junio – 1 julio). Disponible en: http://eprints.rclis. org/19104/ [Consulta: 21 de octubre de 2013].

BLÁZQUEZ OCHANDO, M. (2013a). “Desarrollo tecnológico y documental del webcrawler Mbot: prueba de análisis web de la universidad española”. En: XIII Jornadas Españolas de Documentación, Fesabid, (Toledo, 21- 24 mayo).

BLÁZQUEZ OCHANDO, M. (2013b). Mbot – Webcrawler multipropósito. Disponible en: http:// mblazquez.es/mbot/ [Consulta: 21 de octubre de 2013].

CHAKRABARTI, S.; JOSHI, M.M.; PUNEA, K.; PENNOCK, D.M. (2002). The structure of broad topics on the Web. En: Proceedings of the 11th World Wide Web Conference, (Honolulu, Hawaii, May 7–11). 508-516. Disponible en: http://www.cse.iitb.ac.in/soumen/doc/ www2002t/p338-chakrabarti.pdf [Consulta: 21 de octubre de 2013].

COTHEY, V. (2004). Web-crawling reliability. Journal of the American Society for Information Science and Technology. 55(14), 1228–1238. Disponible en: http:// onlinelibrary.wiley.com/doi/10.1002/asi.20078/pdf [doi:10.1002/asi.20078] [Consulta: 21 de octubre de 2013].

DCMI. (2012). DCMI Metadata Terms. Disponible en: http://dublincore.org/documents/dcmi-terms/ [Consulta: 21 de octubre de 2013].

GANSNER, E.R. (2012). Drawing graphs with Graphviz. Disponible en: http://www.graphviz.org/doc/ oldlibguide.pdf [Consulta: 21 de octubre de 2013]. GIL LEIVA, I. (2008). Manual de Indización: teoría y práctica. Gijón: Trea. 67-69.

GRAELLS, E.; BAEZA YATES, R. (2007). Características de la Web Chilena.

HENZINGER, M.R. (2003). Algorithmic challenges in Web search engines. Internet Mathematics, 1(1), 115–126. Disponible en: http://www.internetmathematics.org/ volumes/1/1/pp115_123.pdf [Consulta: 21 de octubre de 2013].

LUHN, H. P. (1958). The Automatic Creation of Literature Abstracts. IBM Journal of Research Development, 2(2), 159-165.

THELWALL, M. (2001). A web crawler design for data mining. Journal of Information Science, 27(5), 319-325. Disponible en: http://citeseerx.ist.psu.edu/viewdoc/ download doi=10.1.1.90.830&rep=rep1&type=pdf [doi: 10.1177/016555150102700503] [Consulta: 21 de octubre de 2013].

W3C. (1999). HTML 4.01 Specification: The global structure of an HTML document. Meta data. Disponible en: http://www.w3.org/TR/REC-html40/struct/global. html#h 7.4.4 [Consulta: 21 de octubre de 2013].


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item