Vuotto, Andrés and Fernandez, Gladys and Bogetti, Celeste Aplicación del factor TF-IDF en el análisis semántico de una colección documental. Biblios, 2015, n. 60. [Journal article (Unpaginated)]
Text
227-1387-3-PB.pdf Download (504kB) |
|
Text
227-1387-3-PB.pdf Download (504kB) |
English abstract
Objective. This paper describes the application of a tool for the semantic analysis of a document collection based on the use of term frequency–inverse document frequency (TF – IDF). Methodology. A system based on PHP and MySQL database for the management of a thesaurus, the calculation of TF – IDF (as an indicator of semantic weight) and for development a relevance tree (consisting of those concepts is developed most relevant issue analyzed). The tool was tested to the semantic analysis of a documentary collection of Psychology. Results. The system was able to identify the level of track presence: professional ethics, in a collection of documents Psychology program. Conclusions. The experience described confirms the viability of the tool for the semantic analysis of a documentary collection. It underlines the relevance and capacities of information professionals to develop this kind of tools for processing information. The authors suggests a special technical approach for use of scripts and information flows.
Spanish abstract
Objetivo. Describe la aplicación de una herramienta para el análisis semántico de una colección documental, basada en el uso de la frecuencia de término – frecuencia inversa de documento (TF-IDF). Metodología. Se desarrolla un sistema, basado en lenguaje PHP y bases de datos MySQL, para la gestión de un tesauro, del cálculo TF-IDF (como indicador de peso semántico) y para el desarrollo de un árbol de relevancia (conformado por aquellos conceptos más relevantes del tema analizado). Se evaluó la herramienta en el análisis semántico de una colección documental de Psicología. Resultados. El sistema logró identificar el nivel de presencia del tema: deontología profesional, en una colección los documentos del programa de Psicología. Conclusiones. La experiencia descrita confirma la viabilidad de la herramienta para el análisis semántico de una colección documental. Destaca la pertinencia y las capacidades de los profesionales de la información para el desarrollo de herramientas para el tratamiento de información. Los autores sugieren un especial abordaje técnico a partir del uso de scripts y de flujos de la información.
Item type: | Journal article (Unpaginated) |
---|---|
Keywords: | Análisis semántico; TF-IDF; Recuperación de información; Minería de datos; Extracción de información en bases de datos |
Subjects: | B. Information use and sociology of information > BH. Information needs and information requirements analysis. I. Information treatment for information services > IE. Data and metadata structures. L. Information technology and library technology > LL. Automated language processing. |
Depositing user: | Lic. Andrés Vuotto |
Date deposited: | 29 Oct 2016 23:07 |
Last modified: | 29 Oct 2016 23:07 |
URI: | http://hdl.handle.net/10760/30179 |
References
Downloads
Downloads per month over past year
Actions (login required)
View Item |