La indización de artículos científicos con el sistema de indización automática SISA comparada con la indizaicón en las Bases de datos Agricola, WoS y SCOPUS

Gil-Leiva, Isidoro La indización de artículos científicos con el sistema de indización automática SISA comparada con la indizaicón en las Bases de datos Agricola, WoS y SCOPUS., 2017 . In III Congresso ISKO Espanha Portugal, XIII Congresso ISKO Espanha, Coimbra, Portugal, 23-24 Noviembre 2017. [Conference paper]

[thumbnail of Gil-Leiva isko2017_509_524.pdf]
Preview
Text
Gil-Leiva isko2017_509_524.pdf

Download (1MB) | Preview

English abstract

Since some years the generation of digital documents is enormous as well as its massive incorporation to the information systems and both realities seem unstoppable. Likewise, there is no doubt that indexing is one of the fundamental processes executed in documentary units. Although the first investigations in automatic indexing began decades ago this subject continues to raise interest. Since then different proposals and methodologies have been presented. SISA is a multilingual automatic indexing system for scientific articles based on heuristic and statistical principles governed by rules based on these principles. Objective. In this described context of constant digital increase, it is sought to know the SISA capabilities in the automatic indexing of articles in relation to how they do it in the Agricola, WOS and SCOPUS databases. Material and method. One hundred articles published in different years by the journal Agronomy for sustainable development were randomly selected, the indexing assigned to the articles in the mentioned databases was located, the documents were indexed with SISA, the different indexing were compared and they were calculated the consistency between Agricola and SISA.

Spanish abstract

Desde hace unos años la generación de documentos digitales es enorme así como su incorporación masiva a los sistemas de información y ambas realidades parecen imparables. Del mismo modo, no hay duda de que la indización es uno de los procesos fundamentales ejecutados en las unidades documentales. Aunque las primeras investigaciones en automatización de la indización se iniciaron hace décadas este asunto sigue suscitando interés. Desde entonces diferentes propuestas y metodologías han sido planteadas. SISA es un sistema de indización automática multilingue para artículos científicos fundamentado en principios heurísticos y estadísticos regido mediante reglas basadas en dichos principios. Objetivo. En este contexto descrito de incremento digital constante, se persigue conocer las capacidades de SISA en la indización automática de artículos en relación a cómo lo hacen en las bases de datos Agricola, WOS y SCOPUS. Material y método. Se seleccionaron al azar cien artículos publicados en diferentes años por la revista de Agricultura Agronomy for sustainable development, se localizó la indización asignada a los artículos en las mencionadas bases de datos, se indizaron los documentos con SISA, se compararon las diferentes indizaciones y se calcularon los índices de consistencia entre Agricola y SISA. Conclusiones. Las capacidades de indización de SISA en relación a las bases de datos de referencia han sido satisfactorias, si bien se precisan algunos ajustes. SISA ha producido un número medio de descriptores por documento similares a Agricola y Scopus, si bien, los descriptores compuestos de SISA es menor que en estas dos bases de datos. Asimismo, el 21,61% de consistencia conseguido entre SISA y Agricola se encuentra dentro de los porcentajes en este tipo de estudios. Por último, la propuesta de una fórmula integral para la evaluación de la indización automática denominada Evaluación Robusta de la Indización (ERI) permitiría estimar de una manera sólida la viabilidad de un sistema de indización automática.

Item type: Conference paper
Keywords: Indización automática, Evaluación, SISA, Bases de datos, Agricola, WoS, Scopus, ERI, Evaluación Robusta de la Indización; Automatic indexing, Evaluation, SISA, databases, Agricola, WoS, Scopus, RIE, Robust Indexing Evaluation
Subjects: L. Information technology and library technology > LL. Automated language processing.
Depositing user: Isidoro Gil Leiva
Date deposited: 20 May 2018 21:45
Last modified: 20 May 2018 21:45
URI: http://hdl.handle.net/10760/32645

References

Anderson, James D. & Perez-Carballo, José. (2001). The nature of indexing: How humans and machines analyze messages and texts for retrieval. Part I: Research and the nature of human indexing. Information Processing & Management, 37(2), 231-54.

Farrow, John F. (1991), A cognitive process model of document indexing. Journal of Documentation, 47(2), 149-166.

Frohmann, Bernd. (1990). Rules of indexing: a critique of mentalism in information retrieval theory. Journal of Documentation, 46(2), 81-101.

Fugmann, Robert. (1993). Subject analysis and indexing: Theoretical foundation and practical advice. Frankfurt/Main: Indeks Verlag.

Gil-Leiva, Isidoro & Rodríguez Muñoz, José Vicente (1997). Análisis de los descriptores de diferentes áreas de conocimiento indizadas en bases de datos del CSIC. Aplicación a la indización automática. Revista Española de Documentación Científica, 20, 150-60.

Gil-Leiva, Isidoro. (2001). Consistencia en la asignación de materias en Bibliotecas Públicas del Estado. Boletín de la Asociación Andaluza de Bibliotecarios, 63, 69-86.

Gil-Leiva, Isidoro. (2002). Consistencia en la indización de documentos entre indizadores noveles. Anales de Documentación, 5, 99-111.

Gil-Leiva, Isidoro. (2008). Manual de indización. Teoría y práctica. Gijón: Trea.

Gil-Leiva, Isidoro (2017). SISA: Automatic indexing system for scientific articles. Experiments with location heuristics rules versus TF-IDF rules. Knowledge Organization, 43(3), 139-162.

Golub, Koraljka, Soergel, Dagobert, Buchanan, George, Tudhope, Douglas, Likke, Marianne and Hiom, Debra. (2016). A framework for evaluating automatic indexing or classification in the context of retrieval. Journal of the Association for Information Science and Technology, 67(1), 3-16.

Hjorland, Biger. (1997). Information seeking and subject representation: An activity-theoretical approach to information science. Westport, CT: Greenwood Press.

Hooper, Robert S. (1965). Indexer Consistency Tests: Origin, Measurement, Results, and Utilization. Bethesda: IBM Corporation.

ISO 5963:1985 : Documentation -- Methods for examining documents, determining their subjects, and selecting indexing terms. Geneva: ISO.

Lancaster, Frederick W. (1991). Indexing and abstracting in theory and practice. Champaign: University of Illinois.

Mai, Jens-Erik. (2000). Deconstructing the Indexing Process. Advances in Librarianship, 23, 269-298.

Rolling, Loll N. (1981). Indexing Consistency, Quality and Efficiency. Information Processing & Management, 17, 69-76.

Souza, Renato Rocha & Gil-Leiva, Isidoro. (2016). Automatic Indexing of Scientific Texts: A Methodological Comparison. In Chaves Guimarães, José Augusto, Oliveira Milani, Suelen & Dodebei, Vera. Knowledge Organization for a Sustainable World: Challenges and Perspectives for Cultural, Scientific, and Technological Sharing in a Connected Society: Proceedings of the Fourteenth International ISKO Conference 27-29 September 2016, Rio de Janeiro, Brazil, Advances in Knowledge Organization, 2016 (pp. 243-250). Würzburg: Ergon Verlag.


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item