Propuesta de actualización de macro-tesauros a partir de noticias de divulgación científico-tecnológica

Baños-Moreno, María-José and Pastor-Sánchez, Juan-Antonio and Martínez-Béjar, Rodrigo Propuesta de actualización de macro-tesauros a partir de noticias de divulgación científico-tecnológica., 2013 . In I Congreso ISKO España y Portugal / XI Congreso ISKO España, Porto (Portugal), 7-9 November 2013. [Conference paper]

[img]
Preview
Text
13_isko_apachesolr_elis.pdf - Published version

Download (548kB) | Preview

English abstract

Thesauri are knowledge organization instruments, necessary for the information control, especially in the digital information world. But many of them suffer a lack of update that reduces its usefulness. This work analyzes the updating level of two important thesauri: the UNESCO thesaurus and the European Union thesaurus (Eurovoc) to describe newspaper articles. We proceeded to the extraction of descriptive terms from popular science articles headlines published in digital press. Using Information Retrieval techniques equivalences were searched in both thesauri. Results show an exact equivalence level around 50%. Considering hierarchical and associative equivalences this percentage is close to 75%. This data confirms that both macro- thesauri can be the basis for developing other vocabularies. In case of their application for indexing popular science news, Eurovoc is slightly better than the UNESCO thesaurus, since terms and relationships are more updated. The exact or close equivalence level shows that popular science news are a proper source for updating thesauri for inclusion of new terms or to redefine the relationships between these

Spanish abstract

Los tesauros son herramientas de organización del conocimiento necesarias para el control de la información, más aún en el mundo de la información digital. Sin embargo, muchos de ellos adolecen de una falta de actualización que reduce considerablemente su utilidad. Este trabajo tiene precisamente como objetivo analizar el grado de actualización de dos de los tesauros más importante, el de la UNESCO y el de la Unión Europea (Eurovoc). Así, para la descripción de artículos de prensa, se procedió a la extracción de términos descriptivos de contenido a partir de titulares de artículos de divulgación científico-tecnológica publicados en prensa digital. A continuación mediante técnicas de Recuperación de Información se buscaron equivalencias con los tesauros mencionados anteriormente. Los resultados obtenidos muestran un nivel de equivalencia exacta o cercana que ronda el 50%. Este porcentaje se aproxima al 75% considerando equivalencias jerárquicas y asociativas. Este dato permite confirmar que ambos macro-tesauros pueden ser la base para elaborar otros vocabularios. En el caso concreto de su aplicación para la indización de noticias de divulgación científico-tecnológica, Eurovoc es ligeramente mejor que el Tesauro de la UNESCO, puesto que los términos y relaciones están más actualizados. El nivel de equivalencia exacta o cercana indica que las noticias de divulgación científico-tecnológica constituyen una fuente adecuada para la actualización de tesauros bien para la inclusión de nuevos términos o para la redefinición de las relaciones entre estos

Item type: Conference paper
Keywords: UNESCO Thesaurus. EUROVOC Thesaurus. Popular scientific news. Updating thesaurus. Apache Solr
Subjects: I. Information treatment for information services > ID. Knowledge representation.
L. Information technology and library technology > LK. Software methodologies and engineering.
Depositing user: María-José Baños-Moreno
Date deposited: 15 Nov 2013 14:31
Last modified: 02 Oct 2014 12:29
URI: http://hdl.handle.net/10760/20684

References

Alcíbar Cuello, M. (2004). La divulgación mediática de la ciencia y la tecnología como recontextualización discursiva. Anàlisi: Quaderns de comunicació i cultura, (31), 43–70.

Areas da Luz Fontes, A. B., Yeh, L. H., & Schwartz, A. I. (2010). Desambiguação lexical bilíngue: a natureza dos efeitos de coativação lexical entre as línguas. Letrônica: Revista Digital do PPGL, 3(1). Recuperado de http://revistaseletronicas.pucrs.br/ojs/index.php/letronica/article/view/7074

Banco Mundial. (2012). Indicadores del desarrollo mundial: PIB (US$ a precios actuales) (Estadística). Recuperado de http://datos.bancomundial.org/indicador/NY.GDP.MKTP.CD

Castillo Blasco, L. (2006). Elaboración de un tesauro de información de actualidad y conversión en red semántica para su empleo en un sistema de recuperación periodístico. Universidad de Valencia, Valencia. Recuperado de http://www.tdx.cat/bitstream/handle/10803/9982/castillo.pdf?sequence=1

Cleverdon, C. W., & Keen, M. (1966). Aslib Cranfield research project - Factors determining the performance of indexing systems; Volume 2, Test results (p. 299). Crandfield: National Science Foundation. Recuperado de http://dspace.lib.cranfield.ac.uk/handle/1826/863

Currás, E. (1991). Thesauros. Lenguajes terminológicos. Madrid: Paraninfo.

Degani, T., & Tokowicz, N. (2010). Semantic ambiguity within and across languages: An integrative review. The Quarterly Journal of Experimental Psychology, 63(7), 1266-1303.

Del Valle Gastaminza, F. del, & García Jiménez, A. G. (2002). Construcción de un tesauro para el Centro de Documentación de Telecinco. Scire: Representación y organización del conocimiento, 8(1), 103–113.

Dialnet Snapshot. (n.d.). Recuperado de http://dialnet.unirioja.es/servlet/articulo?codigo=1301998

Ewketu, M. (2011, November 28). The UNESCO Thesaurus. Presented at the UN-LINKS Meeting, París. Recuperado de http://www.unesco.org/library/PDF/The%20UNESCO%20Thesaurus.pdf

Fernández Muerza, A. (2005a). Estudio del periodismo de información científica en la prensa de referencia: el caso español a partir del análisis comparativo. Universidad del País Vasco. Recuperado de http://e-ciencia.com/afm/tesis-alex.pdf

Fernández Muerza, A. (2005b). La información científica en la prensa de referencia: el caso español a partir de un análisis comparativo. ZER Revista de Estudios de Comunicación, 19, 205–232.

Fernández-Quijada, D. (2012). El uso de tesauros para el análisis temático de la producción científica: apuntes metodológicos desde una experiencia práctica. BiD: textos universitaris de biblioteconomia i documentació, 29. Recuperado de http://www.ub.edu/bid/29/fernandez2.htm

García Jiménez, A. G. (2002). Metodología de validación del análisis documental y de los lenguajes documentales en el discurso periodístico. Universidad Complutense de Madrid, Madrid. Recuperado de http://www.ucm.es/BUCM/tesis/19911996/S/3/S3005101.pdf

Garrod, P. (2000). Use of the “UNESCO Thesaurus” for archival subject indexing at UK-NDAD (UK-National-Digital-Archive-of-Datasets, database, terms, web, online catalogues). Journal of the Society of Archivists, 21(1), 37–54. doi:10.1080/00379810050006902

Gil-Leiva, I. (2007). The indexing at the Internet. Brazilian Journal of Information Science, (2), 47–68.

International Monetary Fund. (2013). World economic outlook : a survey by the staff of the International Monetary Fund. Washington, DC: International Monetary Fund. Recuperado de http://www.zotero.org/styles/iso690-numeric-en

ISO. (2011). ISO 25964-2:2011. Thesauri and interoperability with other vocabularies. Part 1: Thesauri for information retrieval.

Kolar, M., Vukmirovic, I., Basic, B. D., & Snajder, J. (2005). Computer aided document indexing system. (V. L. Luzar & V. H. Dobric, Eds.). Zagreb: Srce Univ Computing Centre, Univ Zagreb.

Liang, G. B. M. J. (2001). Experiments in Trilingual Cross-Language Information Retrieval. In Proceedings 2001 Symposium on Document Image Understanding Technology (Univ. Maryland), 169-179.

López Alonso, M. Á. (2003). Compilación de un macro-tesauro conceptual para los centros españoles de información juvenil. Scire: Representación y organización del conocimiento, 9(1), 47–56.

Nagypál, G. (2005). Improving information retrieval effectiveness by using domain knowledge stored in ontologies. In On the Move to Meaningful Internet Systems 2005: OTM 2005 Workshops (Vol. 3762, pp. 780–789). Presented at the OTM Confederated International Workshops and Posters, Cyprus: Springer. Recuperado de http://dip.semanticweb.org/documents/Gabor-Nagypal-Improving-information-retrieval-effectiveness-by-using-domain-knowledge-stored.pdf

Narukawa, C. M., Leiva, I. G., & Fujita, M. S. L. (2009). Indexação automatizada de artigos de periódicos científicos: análise da aplicação do software SISA com uso da terminologia DeCS na área de Odontologia. Informação & Sociedade: Estudos, 19(2). Recuperado de http://www.ies.ufpb.br/ojs/index.php/ies/article/view/2925

Observatorio Estatal de Discapacidad. (2009). Tesauro de la discapacidad. Badajoz: Observatorio Estatal de Discapacidad. Recuperado de http://www.observatoriodeladiscapacidad.es/sites/default/files/tesauro%20de%20la%20discapacidad.pdf

Orenga-Gaya, L., & Giralt, O. (2011). The official gazette of the Generalitat de Catalunya: genesis of a digital newspaper. Profesional De La Informacion, 20(3), 340–344. doi:10.3145/epi.2011.may.14

Pastor-Sánchez, J.-A. (2009). Diseño de un sistema colaborativo para la creación y gestión de tesauros en Internet basado en SKOS. Universidad de Murcia, Murcia. Recuperado de http://www.tesisenred.net/handle/10803/10914

Pérez Agüera, J. R. (2004). Automatización de tesauros y su utilización en la web semántica. BiD: textos universitaris de biblioteconomia i documentació, 13. Recuperado de http://www.ub.edu/bid/13perez2.htm

Shiri, A., Nicholson, D., & McCulloch, E. (2004). User evaluation of a pilot terminologies server for a distributed multi-scheme environment. Online Information Review, 28(4), 273–283. doi:10.1108/14684520410553769

Slype, G. van. (1991). Los lenguajes de indización. Concepción, construcción y utilización en los sistemas documentales. Madrid: Pirámide.

Smiraglia, R. P. (2012). Organización del conocimiento: Algunas tendencias en un dominio emergente. El Profesional de la Información, 21(3), 225–227.

Soler Monreal, C., & Gil Leiva, I. (2011). Evaluation of controlled vocabularies by inter-indexer consistency. Information Research, 16(4). Recuperado de http://informationr.net/ir/16-4/paper502.html

Sweeney, L. (2001). Information Explosion. In L. Zayatz, P. Doyle, J. Theeuwes, & J. Lane (Eds.), Confidentiality, Disclosure, and Data Access: Theory and Practical Applications for Statistical Agencies. Washington, DC: Urban Institute. Recuperado de http://dataprivacylab.org/dataprivacy/projects/explosion/explosion2.pdf

Tolosa, G. H., & Bordignon, F. R. A. (2008). Introducción a la Recuperación de Información: Conceptos, modelos y algoritmos básicos. Buenos Aires: Universidad Nacional de Luján. Recuperado de http://hdl.handle.net/10760/12243

UNESCO. (1995). Tesauro de la Unesco. Construir la paz en la mente de los hombres y de las mujeres. Recuperado February 14, 2013, de http://databases.unesco.org/thessp/

UNIÓN EUROPEA. (2012). EuroVoc, tesauro multilingüe de la Unión Europea. Recuperado May 9, 2013, de http://eurovoc.europa.eu/drupal/?q=es

Van Hage, W. R., Sini, M., Finch, L., Kolb, H., & Schreiber, G. (2010). The OAEI food task: An analysis of a thesaurus alignment task. Appl. Ontol., 5(1), 1–28.


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item