Mochón Bezares, Gonzalo, Méndez Rodríguez, Eva and Sorli Rojo, Ángela Etiquetado social y blog-scraping como alternativa para la actualización de vocabularios controlados: Aplicación práctica a un tesauro de Biblioteconomía y Documentación. Información, Cultura y Sociedad, 2017, n. 37, pp. 13-26. [Journal article (Paginated)]
Preview |
Text
13-26.pdf - Published version Download (321kB) | Preview |
English abstract
The aim of this paper is to compare the use of free language tags, taken in our case from specialized blogs on information sciences, against the unstructured controlled language of keywords lists, for verifying which of them is the best source of new terminology for the Librarianship Thesaurus and Documentation. To do this, authors' labels were extracted from 127 blogs on librarianship and information science using web scraping techniques, and were compared with descriptors and identifiers lists of the ISOC library and documentation database (ISOC-BD). The results of the analysis of authors' tags in blogs contribute with 186 new terms, while the database lists only 130 terms. It is concluded that free language tags could be a better and faster way for contributing new terminology to controlled vocabularies than unstructured controlled language lists.
Spanish abstract
El objetivo de este artículo es comparar las etiquetas en lenguaje libre, tomadas en nuestro caso de blogs especializados en ciencias de la información (information sciences), frente al lenguaje controlado no estructurado de las listas de palabras clave, con el fin de comprobar cuál de estos dos es una mejor fuente de nueva terminología para el Tesauro de Biblioteconomía y Documentación. Para ello, se extrajeron las etiquetas de autor de 127 blogs sobre biblioteconomía y documentación mediante técnicas de web scraping, y se compararon con los listados de descriptores e identificadores de la base de datos ISOC Biblioteconomía y Documentación (ISOC-BD). El análisis de las etiquetas de autor de blogs ha aportado 186 nuevos términos, mientras que los listados de la base de datos han proporcionado 130 términos. Se concluye que las etiquetas en lenguaje libre pueden ser una mejor y más rápida vía de aporte de nueva terminología a los vocabularios controlados que los listados de lenguaje controlado no estructurado.
Item type: | Journal article (Paginated) |
---|---|
Keywords: | Etiquetado social; Mantenimiento de tesauros; Blogs; Biblioteconomía y documentación; Extracción terminológica; Social tagging; Thesauri maintenance; Blogs; Library and information science; Terminological extraction |
Subjects: | G. Industry, profession and education. > GH. Education. |
Depositing user: | Graciela Giunti |
Date deposited: | 04 Sep 2018 12:13 |
Last modified: | 04 Sep 2018 12:13 |
URI: | http://hdl.handle.net/10760/33314 |
References
Downloads
Downloads per month over past year
Actions (login required)
View Item |