Aproximación Bio-Bibliométrica a la Detección de Relaciones Biológicas entre Genes
(2007) Aproximación Bio-Bibliométrica a la Detección de Relaciones Biológicas entre Genes. In Proceedings 2nd Iberian Conference on Information Systems and Technologies - CISTI 2007 I, pp. 469-480, Porto (Portugal).
Full text available as: |
Abstract
[Spanish abstract]
La investigación bioinformática ha generado una gran cantidad de literatura biomédica almacenada en bases de datos tales como MEDLINE. La extracción de información de la literatura publicada se puede aplicar para detectar relaciones biológicas entre genes. La premisa del análisis Bio-Bibliométrico es la siguiente: si dos símbolos de gen aparecen en el mismo documento es probable que estén relacionados (por el principio de co-ocurrencia). Estos datos se pueden utilizar para calcular la ‘distancia biobibliométrica’ entre pares de genes de un genoma completo. En este trabajo, realizamos un sencillo experimento basado en este planteamiento con el objetivo de extraer y visualizar información de la literatura biomédica relacionada con la enfermedad del linfoma. Las principales limitaciones de este método son la unificación de las diferentes variantes de nombres de gen, para que no se produzcan co-ocurrencias incorrectas, y la identificación del tipo de interacción genómica.
[English abstract]
The bioinformatics research has generated a large quantity of biomedical literature stored in databases, such as MEDLINE. The information extraction of the literature published can apply to detect biological relations among genes. The premise of the Bio-Bibliometric Analysis is the following one: if two symbols of gene appear in the same document is likely that be related, by the principle of co-occurrence. These data can be utilized to calculate the 'biobibliometric distance' among genes of a complete genome. In this work, we carry out a straightforward experiment based on this approach with the objective to extract and to visualize information of the biomedical literature related to the lymphoma disease. The main limitations of this method are the unification of the different gene-naming variants (to avoid the incorrect co-occurrences) and the identification of the type of genomic interactions
| Keywords: | Análisis bio-bilbiométrico; minería de textos; redes de genes; BioBibliometrics; Genes; Gene Networks; Text Mining |
|---|---|
| Subjects: | I. Information treatment for information services > IC. Index languages, processes and schemes. B. Information use and sociology of information. > BB. Bibliometric methods. |
| ID Code: | 11078 |
| Deposited By: | Carmen, Galvez |
| Deposited On: | 08 August 2007 |
| All fields: | Show all fields |
Archive Staff Only: edit this record

