Baños-Moreno, María-José, Pastor-Sánchez, Juan-Antonio and Martínez-Béjar, Rodrigo Propuesta de actualización de macro-tesauros a partir de noticias de divulgación científico-tecnológica., 2013 . In I Congreso ISKO España y Portugal / XI Congreso ISKO España, Porto (Portugal), 7-9 November 2013. [Conference paper]
Preview |
Text
13_isko_apachesolr_elis.pdf - Published version Download (548kB) | Preview |
English abstract
Thesauri are knowledge organization instruments, necessary for the information control, especially in the digital information world. But many of them suffer a lack of update that reduces its usefulness. This work analyzes the updating level of two important thesauri: the UNESCO thesaurus and the European Union thesaurus (Eurovoc) to describe newspaper articles. We proceeded to the extraction of descriptive terms from popular science articles headlines published in digital press. Using Information Retrieval techniques equivalences were searched in both thesauri. Results show an exact equivalence level around 50%. Considering hierarchical and associative equivalences this percentage is close to 75%. This data confirms that both macro- thesauri can be the basis for developing other vocabularies. In case of their application for indexing popular science news, Eurovoc is slightly better than the UNESCO thesaurus, since terms and relationships are more updated. The exact or close equivalence level shows that popular science news are a proper source for updating thesauri for inclusion of new terms or to redefine the relationships between these
Spanish abstract
Los tesauros son herramientas de organización del conocimiento necesarias para el control de la información, más aún en el mundo de la información digital. Sin embargo, muchos de ellos adolecen de una falta de actualización que reduce considerablemente su utilidad. Este trabajo tiene precisamente como objetivo analizar el grado de actualización de dos de los tesauros más importante, el de la UNESCO y el de la Unión Europea (Eurovoc). Así, para la descripción de artículos de prensa, se procedió a la extracción de términos descriptivos de contenido a partir de titulares de artículos de divulgación científico-tecnológica publicados en prensa digital. A continuación mediante técnicas de Recuperación de Información se buscaron equivalencias con los tesauros mencionados anteriormente. Los resultados obtenidos muestran un nivel de equivalencia exacta o cercana que ronda el 50%. Este porcentaje se aproxima al 75% considerando equivalencias jerárquicas y asociativas. Este dato permite confirmar que ambos macro-tesauros pueden ser la base para elaborar otros vocabularios. En el caso concreto de su aplicación para la indización de noticias de divulgación científico-tecnológica, Eurovoc es ligeramente mejor que el Tesauro de la UNESCO, puesto que los términos y relaciones están más actualizados. El nivel de equivalencia exacta o cercana indica que las noticias de divulgación científico-tecnológica constituyen una fuente adecuada para la actualización de tesauros bien para la inclusión de nuevos términos o para la redefinición de las relaciones entre estos
Item type: | Conference paper |
---|---|
Keywords: | UNESCO Thesaurus. EUROVOC Thesaurus. Popular scientific news. Updating thesaurus. Apache Solr |
Subjects: | I. Information treatment for information services > ID. Knowledge representation. L. Information technology and library technology > LK. Software methodologies and engineering. |
Depositing user: | María-José Baños-Moreno |
Date deposited: | 15 Nov 2013 14:31 |
Last modified: | 02 Oct 2014 12:29 |
URI: | http://hdl.handle.net/10760/20684 |
References
Downloads
Downloads per month over past year
Actions (login required)
View Item |