G.-Figuerola, Carlos, Zazo, Ángel F. and Alonso-Berrocal, José-Luis Categorización automática de documentos en español: algunos resultados experimentales., 2000 . In Primeras Jornadas de Bibliotecas Digitales. JBIDI'2000, Valladolid (España), 6 y 7 de Noviembre. [Conference paper]
Preview |
PDF
figuerola2000retrieval.pdf Download (16kB) | Preview |
English abstract
The automatic categorization can be viewed as a learning process, during which a program captures the characteristics that distinguish each category or class from others, ie those who must have documents to belong to that category. On the other hand, few experiments have been carried out yet with documents in Spanish. It shows the possibilities of elaborating pattern vectors which collect the characteristics of different classes or categories of documents by techniques based on those applied in the expansion of queries by relevance. At the same time, describes an experiment involving the application of these techniques to a collection of press releases in Spanish, for categorization. The results are, overall, qualified, or even better than those obtained in similar experiments, for some categories, these results improve
Spanish abstract
La categorización automática puede contemplarse como un proceso de aprendizaje, durante el cual un programa capta las características que distinguen cada categoría o clase de las demás, es decir, aquéllas que deben poseer los documentos para pertenecer a esa categoría. De otro lado, pocos experimentos se han efectuado todavía con documentos en español. Se muestran las posibilidades de elaborar vectores patrón que recojan las características de distintas clases o categorías de documentos, utilizando técnicas basadas en aquéllas aplicadas en la expansión de consultas por relevancia. Al mismo tiempo, se describe un experimento consistente en la aplicación de esas técnicas a una colección de noticias de prensa en español, para su categorización. Los resultados obtenidos son, en conjunto, homologables o incluso mejores que los obtenidos en experimentos similares; para algunas de las categorías, estos resultados han sido muy favorables
Item type: | Conference paper |
---|---|
Keywords: | Categorización automática ; expansión de consultas, español, lenguaje natural, recuperación de la información |
Subjects: | L. Information technology and library technology > LZ. None of these, but in this section. I. Information treatment for information services > IZ. None of these, but in this section. |
Depositing user: | R. Gómez-Díaz |
Date deposited: | 15 Dec 2009 |
Last modified: | 02 Oct 2014 12:16 |
URI: | http://hdl.handle.net/10760/14009 |
References
Downloads
Downloads per month over past year
Actions (login required)
View Item |