El diccionario electrónico: un instrumento para la unificación de términos en la indización automática

Galvez, Carmen El diccionario electrónico: un instrumento para la unificación de términos en la indización automática. Linguax: Revista de Lenguas Aplicadas (ISSN 1695-632X), 2006. [Journal article (Unpaginated)]

[thumbnail of Galvez-Linguax.pdf]
Preview
PDF
Galvez-Linguax.pdf

Download (224kB) | Preview

English abstract

An application based on state-finite techniques is presented with the objective to build electronic dictionaries that can apply to the processes of term unificatio in the automatic indexation. The method utilized for the construction of the lexicalanalysis tools consists of the implementation of a linguistic enviroment that permits to build electronic dictionaries represented internally in finite-state transducers (FST).

Spanish abstract

Se presenta una aplicación basada en técnicas de estado-finito con el objetivo de construir diccionarios electrónicos que se puedan aplicar a los procesos de unificación de términos en la indización automática. El método utilizado para la construcción de las analizadores léxicos consiste en la implementación de una herramienta lingüística que permite elaborar diccionarios electrónicos representados internamente en transductores de estado-finito.

Item type: Journal article (Unpaginated)
Keywords: Term unification; Lemmatisation; Conflation of term variants; Unificación de términos; Lematización; Reducción de variantes léxicas.
Subjects: L. Information technology and library technology > LL. Automated language processing.
Depositing user: Carmen Galvez
Date deposited: 06 Aug 2007
Last modified: 02 Oct 2014 12:08
URI: http://hdl.handle.net/10760/10018

References

AÏT-MOKHTAR, S., RODRIGO MATEOS, J. L. (1995): «Segmentación y análisis morfológico de textos en español utilizando el sistema SMORPH», en Procesamiento del Lenguaje Natural, vol. 17, pp. 29-41.

ALEGRÍA, I. (1995): Euskal morfologiaren tratamendu automatirako tresnak, Tesis doctoral, Universidad del País Vasco.

BADÍA, T. (1997): «CATMORF: multi two-level steps for Catalan morphology», en Applied Natural Language Proceedings, ANLP 97, Washington.

CARMONA, J., CERVELL, S., MARQUEZ, L.: MARTI, M. A., PADRO, L., PLACER, R., RODRIGUEZ, H., TAULE, M. y TURMO, J. (1998): «An environment for morphosyntactic processing of Spanish unrestricted text», en First Internacional Conference on Language Resources and Evaluation, TREC 98, Granada.

DAWSON, J. L. (1974): «Suffix removal for word conflation», en Bulletin of the Association for Literary & Linguistic Computing, vol. 2, n. 3, pp. 33-46.

FARWELL, D., HELMREICH, S., CASPER, M. (1995): «SPOST: a Spanish part of speech tagger», en Procesamiento del Lenguaje Natural, vol. 17, pp. 42-53.

FRAKES, W. B. (1992): «Stemming algorithms», en FRAKES, W. B. y BAEZA-YATES, R. (eds.): Information retrieval: data structures and algorithms, Prentice-Hall, Englewood Cliffs, NJ.

GALA, N. (1999): «Using the incremental finite-state architecture to create a Spanish shallow parser», en Procesamiento del Lenguaje Natural, vol. 25, pp. 75-823.

GALVEZ, C. (2003): Reconocimiento y normalización de expresiones lingüísticas por medio de transductores de estado-finito, Tesis doctoral, Universidad de Granada.

GALVEZ, C., MOYA-ANEGON, F. y SOLANA, V. H. (2005): «Term conflation methods in information retrieval: non-linguistic and linguistic approaches», en Journal of Documentation, vol. 61, n. 4, pp. 520-547.

HOPCROFT, J. E. y ULLMAN, J. D. (1979): Introduction to Automata Theory, Languages, and Computation. Addison-Wesley: Reading, MA.

JOHNSON, C. D. (1972): Formal Aspects of Phonological Description, Mouton, La Haya.

KARTTUNEN, L. (1994): «Constructing lexical transducers», en Proceedings of the Fifteenth International Conference on Computational Linguistics, COLING 94, Kyoto.

KARTTUNEN, L., KAPLAN, R. M. y ZAENEN, A. (1992): «Two-level morphology with composition», en Proceedings of the 15th International Conference on Computational Linguistics, COLING 92, Nantes, France.

KOSKENNIEMI, K. (1983): Two-level morphology: a general computational model for word-form recognition and production, Department of General Linguistics, University of Helsinki.

LENNON, M., PIERCE, D. S., TARRY, B. D. y WILLETT, P. (1981): «An evaluation of some conflation algorithms for information retrieval», en Journal of Information Science, vol. 3, n. 4, pp. 177-183.

LOVINS, J. B. (1968): Development of a stemming algorithm, en Mechanical Translation and Computational Linguistics, vol. 11, pp. 22-31.

MATTHEWS, P. H. (1974): Morphology. An introduction to the theory of word-structure, Cambridge University Press.

MOHRI, M. (1996): «On some applications of finite-state automata theory to natural language processing», en Journal of Natural Language Engineering, vol. 2, n. 1, pp. 61-80.

PAICE, C. D. (1990): «Another Stemmer», en ACM SIGIR Forum, vol. 24, n. 3, pp. 56-61.

PIRKOLA, A. (2001): «Morphological typology of languages for IR», en Journal of Documentation, vol. 57, n. 3, pp. 330-348.

POPOVIC, M. y WILLET, P. (1992): «The effectiveness of stemming for natural-language access to Slovene textual data», en Journal of the American Society for Information Science, vol. 43, n. 5, pp. 384-90.

PORTER, M. F. (1980): «An algorithm for suffix stripping», en Program, vol. 14, pp. 130-137.

ROCHE, E. y SCHABES, Y. (1995): «Deterministic part-of-speech tagging with finite state transducers», en Computational Linguistics, vol. 21, n. 2, pp. 227-253.

RODRIGUEZ, S. y CARRETERO, J. (1996): «A formal approach to Spanish morphology: the COES tools», en XII Congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural, SEPLN, Sevilla, p. 118-126.

STEVENS, M. E. (1965): Automatic indexing: a state of the art report, National Bureau of Standards, Washington.

SAVOY, J. (1993): «Stemming of French words based on grammatical categories», en Journal of the American Society for Information Science, vol. 44, n. 1, pp. 1-9.

SILBERZTEIN, M. (1999): «Text indexation with INTEX», en Computers and the Humanities, vol. 33, n. 3, pp. 265-80.

SONWBALL WEB SITE, accesible en línea [http://snowball.tartarus.org]

VOUTILAINEN, A. (1995): «Morphological disambiguation», en KARLSSON, F., VOUTILAINEN, A. y HEIKKILA, J. (eds.): Constraint grammar: a language-independent system for parsing unrestricted Text, Mouton de Gruyter, New York, pp. 165-284.


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item