Estudio de la incidencia del conocimiento lingüístico en los sistemas de recuperación de la información para el español

Gómez-Díaz, Raquel Estudio de la incidencia del conocimiento lingüístico en los sistemas de recuperación de la información para el español., 2001 PhD thesis thesis, Universidad de Salamanca. [Thesis]

[img] PDF
DBD_GómezDíazR_Estudiodelaincidencia.pdf

Download (1MB)

English abstract

Today it is necessary to be well informed and the characteristics of the information we need systems that work with natural language or where control of the terms is minimal. For this work we have created a stemmer by a finite state machine nondeterministic order to apply to the recovery of information in Spanish. Function is to remove the suffix stemmer automatically and establish their motto. From the stem is indexing and recovery. To test the effectiveness, stemming experiments are performed inflected and derivative, combining this with the removal of stop words.

Spanish abstract

Hoy en día es necesario estar bien informado y por las características de la información necesitamos sistemas que trabajen con lenguaje natural o donde el control de los términos sea mínimo. Para este trabajo hemos creado un lematizador mediante una máquina de estados finitos no determinista con el fin de aplicarlo a la recuperación de la información en español. La función del lematizador es eliminar los sufijos de manera automática y establecer su lema. A partir de los lemas se hace la indización y posterior recuperación. Para probar la eficacia del mismo, se realizan experimentos de lematización flexiva y derivativa, combinando esto con la supresión de palabras vacías.

Item type: Thesis (UNSPECIFIED)
Keywords: Lematización; Recuperación de la información; Stemmer; Information Retrieval; Procesamiento del lenguaje natural.
Subjects: I. Information treatment for information services > IC. Index languages, processes and schemes.
I. Information treatment for information services > ID. Knowledge representation.
I. Information treatment for information services > II. Filtering.
L. Information technology and library technology > LL. Automated language processing.
Depositing user: R. Gómez-Díaz
Date deposited: 13 May 2011
Last modified: 02 Oct 2014 12:19
URI: http://hdl.handle.net/10760/15670

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item