Identificación de nombres personales por medio de sistemas de codificación fonética

Galvez, Carmen Identificación de nombres personales por medio de sistemas de codificación fonética. Encontros Bibli : Revista Eletrônica de Biblioteconomia e Ciência da Informação, 2006, vol. 2 seme, n. 22, pp. 105-116. [Journal article (Paginated)]

Preview

PDF
Galvez-Encontros-1.pdf
Download (508kB) | Preview

English abstract

The need to identify the variants of personal names is a well-known problem in applications such as information retrieval systems (IRS), digital libraries, databases of patients in a hospital, the electronic systems of air reserves, or the systems of census. The phonetic codification methods constitute one of the procedures for the solution of this problem, permitting to obtain canonical or normalized names. These systems are included inside the general techniques of approximate string matching. In this work a revision of the processes is carried out that utilize the Soundex, Daitch-Mokotoff Soundex, Phonix, Metaphone and NYSIIS systems for the assignment of phonetic keys. The phonetic codification permits reduce to a common form those personal names that are similar in its pronunciation; performance simpler the string matching due to that the common code is stored instead of the complete name. Nevertheless, these systems are dependent of the language utilized, doing necessary the execution of modifications according to the language on the one that apply.

Spanish abstract

La necesidad de identificar las variantes de los nombres personales es un problema muy conocido en diversas aplicaciones, tales como los sistemas de recuperación de información (SRI), las bibliotecas digitales, las bases de datos de pacientes en un hospital, los sistemas de reservas aéreas, o los sistemas de censo. Los métodos de codificación fonética constituyen uno de los procedimientos para la solución de este problema, permitiendo obtener cadenas canónicas o normalizadas. Estos sistemas se engloban dentro de las técnicas generales de equiparación aproximada de cadenas. En este trabajo se realiza una revisión de los procesos que utilizan los sistemas Soundex, Daitch-Mokotoff Soundex, Phonix, Metaphone y NYSIIS para la asignación de claves fonéticas. La codificación fonética permite reducir a una forma común aquellos nombres personales que son similares en cuanto a su pronunciación, haciendo más sencilla la comparación de una cadena con otra, debido a que se almacena el código generado en lugar del nombre completo. Sin embargo, la principal limitación de estos sistemas es que son dependientes del lenguaje utilizado, lo que hace necesario la realización de modificaciones de acuerdo al idioma que se va a emplear.

Item type:	Journal article (Paginated)
Keywords:	Phonetic codification; Personal name-matching; Name-matching techniques; Codificación fonética; Equiparación de nombres personales; Algoritmos de equiparación de nombre.
Subjects:	L. Information technology and library technology > LM. Automatic text retrieval.
Depositing user:	Carmen Galvez
Date deposited:	06 Aug 2007
Last modified:	02 Oct 2014 12:08
URI:	http://hdl.handle.net/10760/10017

Check full metadata for this record

References

Downloads

Downloads per month over past year

Actions (login required)

View Item

Facebook

Twitter

RSS