Extracción y normalización de entidades genómicas en textos biomédicos: una propuesta basada en transductores gráficos

Galvez, Carmen and De-Moya-Anegón, Félix Extracción y normalización de entidades genómicas en textos biomédicos: una propuesta basada en transductores gráficos., 2006 . In 1st Iberian Conference on Information Sciences and Technologies - CISTI 2006, Esposende, Portugal: Escola Superior de Tecnologia (EST), Instituto Politécnico do Cávado e do Ave (IPCA), 21-23 June 2006. [Conference paper]

[thumbnail of Galvez-Congreso-CISTI-2006.pdf]

Preview

PDF
Galvez-Congreso-CISTI-2006.pdf
Download (285kB) | Preview

English abstract

The lack of systems endorsed to call the genes is a problem for the identification of information in the biomedical literature and does very difficult an essential process in the field of the molecular biology: finding and to discover biological relations among genes, in those documents that treat the same genomic entity but that they use different symbols. We propose a procedure taken from the of natural language processing (NLP) based on the application of transducers of finite-state that allows the recognition of the diverse names of a gene and relates them to an unified form. The process of standardization requires as input a list of synonyms, and as an output an unique identifier for that gene. The genomic database FlyBase has contributed us the necessary resources to expose our proposal.

Spanish abstract

La falta de sistemas homologados para denominar a los genes es un problema para la identificación de información en la literatura biomédica y hace muy difícil un proceso esencial en el campo de la biología molecular: encontrar y descubrir relaciones biológicas entre genes, en aquellos documentos que tratan la misma entidad genómica pero que usan símbolos distintos. Nosotros proponemos un procedimiento adoptado del procesamiento de lenguaje natural (PLN) basado en la aplicación de transductores de estado-finito que permite el reconocimiento de los diversos nombres de un gen y los relaciona con una forma unificada. El proceso de normalización requiere como input una lista de sinónimos, y como output un identificador único para ese gen. La base de datos genómica FlyBase nos ha aportado los recursos necesarios para exponer nuestra propuesta.

Item type:	Conference paper
Keywords:	Finite-state transducers; Normalization of gene term; Information extraction; Codificación fonética; Equiparación de nombres personales; Algoritmos de equiparación de nombre.
Subjects:	L. Information technology and library technology > LL. Automated language processing.
Depositing user:	Carmen Galvez
Date deposited:	06 Aug 2007
Last modified:	02 Oct 2014 12:08
URI:	http://hdl.handle.net/10760/10016

Check full metadata for this record

References

Downloads

Downloads per month over past year

Actions (login required)

View Item

Facebook

Twitter

RSS