Indagine comparativa tra i database bibliografici
MEDLINE, EMBASE e PASCAL Biomed

di Antonella De Robbio
<mailto:derobbio@math.unipd.it>



 
 

Scopi e obiettivi della ricerca
 

comparazione tra i tre maggiori database bibliografici
di ambito biomedico
MEDLINE EMBASE  PASCAL Biomed

rilevazione delle coperture dei periodici indicizzati :


Obiettivo principale dell'indagine
 

fornire uno strumento informativo
di supporto per orientare sulle scelte
utile alle valutazioni per l'acquisizione di banche dati del settore
 
 

Utenza a cui è rivolto lo studio




 
 

Tools utilizzati

6 database

tutte in versioni su Cd-Rom per il Sistema di Database Networking ERL (Electronic Reference Library) della Silver Platter, con software di recupero dell'informazione SPIRS, interrogate sia con connessione via client su workstation per ambiente operativo Windows (WinSpirs) sia in accesso via Rete attraverso interfaccia WebSPIRS

· quelli sottoposti a valutazione, a carattere biomedico, MEDLINE, EMBASE, PASCAL Biomed
   Current Contents (come riferimento, ma non come oggetto di indagine)

· quelli utilizzati quale strumento informativo di indagine, due database di periodici:


tecniche di information retrieval sulle banche dati di periodici
 


liste dei periodici indicizzati

relative alle singole basi di dati recuperate dal Web

  • per Current Contents sul sito statunitense dell'ISI (Institute for Scientific Information)
  • per PASCAL Biomed sul sito francese dell'INIST (Institut de l'Information Scientificque et Tecnique) del CNRS (Centre National de la Recherche Scientifique)

  •  

    Valutazione
    ·analisi sulla struttura dei dati/record in relazione alla presenza di campi comuni
    · presenza o meno di abstract, e in che lingua
    · presenza o meno di tesauro o schema classificatorio ai fini del recupero dell'informazione
    · comparazione dei risultati ottenuti per alcune strategie di ricerca sui differenti database scientifici

    ·crescita relativa agli ultimi dieci anni dei periodici di ambito biomedico
    · numero dei periodici correnti indicizzati in relazione ai periodici biomedici totali e in relazione ai periodici esistenti in generale
    · numero dei periodici correnti indicizzati da ciascun database e loro suddivisione per paese di pubblicazione
    · comparazione relativa alla copertura dei periodici relativamente a sovrapposizioni tra database e tra aree geografiche
     


    Le basi di dati differiscono strutturalmente in riferimento a più fattori:

    · versione della stessa banca dati su differente supporto (on-line tradizionale, interfaccia Web, CD-Rom, per piattaforma Database Networking): differenti interfacce e differenti linguaggi per l'interrogazione

    · esistenza di più versioni/edizioni della banca dati anche per stessa titpologia di supporto (parti di database selezionate in base a periodi o ambiti specializzati)

    · versioni con aggiornamenti differenti (CD-Rom con aggiornamenti semestrali, trimestrali, mensili )

    Le basi di dati differiscono anche per diversità di produttore e possono avere: · struttura differente dei record (differenze nei campi: per numero o per nome/etichetta di campo)

    · riferimenti temporali differenti (copertura del database parziale o totale)

    · interfaccia e linguaggio di interrogazione

    il risultato di una ricerca cambia
    anche per lo stesso database
    in riferimento a prodotti differenti

    Schede informative sulle basi di dati utilizzate per la presente ricerca



    Analisi comparativa della struttura dei database


    DATABASE
    N. totali reg.
    bibliografiche
    Incremento annuo
    Presenza di abstract
    campi
    record
    (limit)
    Thesauro
    Periodici coperti
    MEDLINE Advanced 9 milioni 
    (dal 1966)
    Oltre 400.000 68% 
    (dal 1975)
    33 (12)
    TAG
    MesH
    18.000 intestazioni
    4592
    EMBASE 7 milioni
    (dal 1974)
    Oltre 400.000 80% 41 (13)
    EMTAG
    EMTREE
    37.000 termini:
    medici e sostanze
    4168
    PASCAL Biomed

    Tratta da PASCAL

     

    2.600.000

    (dal 1996
    su CD-Rom)

    Oltre 400.000 In inglese

    In francese

    42 (9) Ricerca su campi

    Descrittori, non da Thesauro

    80.000 termini
    in francese, inglese e spagnolo

    6885

    (di cui cover-to-cover 
    oltre 3500)

    EMBASE  più strutturato:
    41 campi, rispetto a  MEDLINE con 33 campi

    EMBASE comprende vari campi relativi alle sostanze e ai farmaci,
    nome della sostanza, ditta produttrice, classificazione della sostanza,
    descrittore della sostanza, sequenza molecolare, ...

    PASCAL Biomed 42 campi per record,  triplicazione dei campi DE (descrittori) e identificatori, riportati in tre lingue diverse.
    Current Contents  45 campi per record.

    EMBASE e MEDLINE  15 campi in comune,
    con stessa etichetta e stesso significato relativamente al contenuto del campo;
    la sovrapposizione con PASCAL Biomed e gli altri due database è di 8 campi.

    In sette casi stessa etichetta di campo per significati diversi e in questi casi sarà necessario prestare attenzione in fase di una ricerca comune su più database.

    EMBASE 13 campi limite,
    MEDLINE 12 campi limite
    PASCL Biomed 9 campi limite,
    sovrapposizione mista per alcuni campi
     

    Tabella comparativa dei campi record dei quattro database: MEDLINE, EMBASE, Current Contents e PASCAL Biomed
     
     

    AB Abstract MED EMB CC PASC Biom
    AD Indirizzo dell'Autore  MED EMB CC

    ***

     
    AF Ente in cui l'Autore afferisce       PASC Biom
    AGE TAG Età MED      
    AI Indicatore presenza di Abstract MED   CC PASC Biom
    AN Numero identificativo del documento MED EMB CC PASC Biom
    AU Autore (CA e PA) MED EMB CC PASC Biom
    AUZ Insieme dei campi autore     CC

    ***

     
    BA Autore del volume     CC  
    BL Livello bibliografico       PASC Biom
    BT Titolo del libro   EMB CC  
    CA Ente Autore     CC PASC Biom
    CC Sezione del Current Contents     CC

    *

     
    CD Data e luogo del congresso (per i record dal 1990)

    CODICE

      EMB  
     
     

    PASC Biom

    CF Nome del congresso (dal 1990)   EMB   PASC Biom
    CM Commento MED      
    CN Numero del contratto o della sovvenzione MED   CC  
    CO Codice identificativo della rivista   EMB    
    CP Paese di pubblicazione MED EMB   PASC Biom
    CR Informazioni sul Copyright     CC PASC Biom
    CT Titolo del congresso (dal 1990)   EMB    
    DA Data di ingresso MED      
    DE Descrittori (Medical Index Term)

    (DEE, DEF, DES)

      EMB   PASC Biom
    DEE Descrittori MIT in Inglese       PASC Biom
    DEF Descrittori MIT in Francese       PASC Biom
    DES Descrittori MIT in Spagnolo       PASC Biom
    DG Data Academic Degree       PASC Biom
    DM Nome della sostanza prodotta   EMB    
    DN Nome della marca del prodotto   EMB    
    DT Tipologia del documento   EMB CC  
    DR Descrittore della sostanza   EMB    
    EC Classificazione EMCLAS   EMB    
    ED Editore/i   EMB CC  
    EL Classificazione EMCLAS della sostanza   EMB    
    EM EMTAGS, concetti generali di indicizzazione

    Indirizzo e-mail (posta elettronica)

      EMB
     
     

    CC

     
    EML Indirizzo e-mail (posta elettronica)   EMB    
    GA Numero identificativo dell'articolo     CC  
    GS Simbolo del gene MED      
    IB International Standard Book Number     CC PASC Biom
    ID Identificatori (IDE, IDF, IDS)       PASC Biom
    IDE Identificatori Inglese       PASC Biom
    IDF Identificatori Francese       PASC Biom
    IDS Identificatori Spagnolo       PASC Biom
    IN Istituzione Ricerca     CC  
    IS International Standard Serial Number

    ISBN/ISSN

      EMB CC PASC Biom
    ISSN International Standard Serial Number MED      
    JC Categoria del periodico MED      
    JI Fascicolo della rivista (table of contents)     CC  
    JN Abbreviazione del titolo della rivista 

    Nome del periodico

    MED   CC

    **

    PASC Biom
    JS Categoria/soggetto del periodico     CC  
    KA Chiavi assegnate dall'autore     CC  
    KP Chiavi Plus assegnate dall'ISI     CC  
    KW Insieme delle chiavi KA e KP     CC

    ***

     
    LA Lingua originale del documento MED EMB CC PASC Biom
    LC Numero Library of Congress     CC  
    LOC Localizzazione del documento primario       PASC Biom
    LS Lingua/e del Sommario   EMB   PASC Biom
    LT Tipo di letteratura       PASC Biom
    MA Numero di abstract della conferenza     CC PASC Biom
    MESH Termini del vocabolario controllato o titolo degli argomenti MED      
    MIME Termini del vocabolario controllato o titolo degli argomenti minori MED      
    MJME Termini del vocabolario controllato o titolo degli argomenti maggiori MED      
    MN Ditta produttrice del farmaco o sostanza   EMB    
    MS Sequenza molecolare   EMB    
    MT Tipo di contenuto del documento (natura o tipologia)       PASC Biom
    NM Nome della sostanza MED      
    NR Numero degli articoli (table of contents)

    Numero di referenze

        CC PASC Biom
    NT Notes       PASC Biom
    OR Informazioni per l'ordine del volume     CC  
    PA Autore personale       PASC Biom
    PB Editore del libro   EMB    
    PD Descrizione fisica     CC  
    PI Identificatore del pubblicatore   EMB    
    PS Nome personale come soggetto MED      
    PT Tipo di pubblicazione MED EMB CC PASC Biom
    PU Editore       PASC Biom
    PY Anno di pubblicazione

    (LT e MT)

    MED EMB CC PASC Biom
    RAP Request-A-Print      CC

    **

     
    RF Numero dei riferimenti bibliografici MED EMB CC  
    RL Lingua del documento a cui si riferisce la recensione/revisione     CC  
    RN Numero assegnato alle sostanze chimiche o agli enzimi (CAS) MED EMB    
    RP Numero di Report

    Autore cui si mandano richieste di estratti

      EMB* CC  
    RPT Informazioni sul Report       PASC Biom
    RT Tipo di record     CC  
    RW Autore del documento a cui si riferisce la recensione/revisione     CC  
    RY Anno di pubblicazione del documento a cui si riferisce la recensione/revisione     CC  
    SB Subset MED      
    SC Identificatore periodico MED      
    SE Titolo della collezione     CC  
    SH SubHeading MESH MED      
    SI Abbrevizione della banca dati in cui è registrata una sequenza molecolare

    Fonte dell'indicizzazione

    MED    
     
     

    PASC Biom

    SN Nome dell'Ente Universitario o Scuola       PASC Biom
    SO Fonte della citazione bibliografica MED EMB CC PASC Biom
    SU Soggetto   EMB

    ***

       
    TG Checktags (speciali descrittori) MED EMB    
    TI Titolo 

    Titolo (T1 e TT)

    MED EMB CC PASC Biom
    T1 Titolo originale       PASC Biom
    TIZ Insieme dei campi titolo     CC

    ***

     
    TN Nome depositato

    Numero ufficiale tesi

      EMB   PASC Biom
    TO Titolo originale non in inglese) MED EMB    
    TS Titoli    EMB

    ***

       
    TT Titolo tradotto       PASC Biom
    UD Codice di aggiornamento MED EMB CC  
    XID Numero del record in ADONIS (solo per il periodo 1991-93)

    (La base dati Adonis contiene dati bibliografici full-text)

      EMB

    *

       

     

    * i campi non sono ricercabili, ma solo visualizzabili
    ** i campi non sono nè ricerbali, nè visualizzabili, servono unicamente per downloading o per document delivery
    *** i campi sono unicamente ricercabili, ma non visualizzabili (set di campi ricercabili assieme)


    differenze tra
    MEDLINE ed EMBASE
    rilevate da
    Greenhalgh ,  nel 1997
    British medical Journal,
    periodo luglio-agosto 1996.

    la metodologia utilizzata deve tener conto di più fattori:


    Gli argomenti/query posti si sono riferiti a:

  • tecnica Lasik (laser in situ keratomileusis) applicata alla miopie di grado alto
  • utilizzo di nebulizzatori per la somministrazione di farmaci per la terapia dell'asma
  • Sarcoma di Kaposi come patologia secondaria dell'AIDS
  • non evidenziare articoli comuni recuperati,
    ma bensì valutare le tecniche messe a dispozione dai database,
    gli strumenti offerti in relazione a differenti esigenze informative e le potenzialità complessive, intrinseche ed estrinseche, di ciascun database.
     
     



    Risultati di valutazione complessiva



    Queste peculiarità permettono di reperire informazioni rilevanti per esempio per il campo della Medicina Basata sulle Evidenze, laddove si possono trasversalmente settorializzare tutti gli articoli solo di ambito clinico, oppure tutti quelli con TAG "human" e, nel caso di applicazioni terapeutiche, limitare a campi TAG "Age", per fasce di età.



     


    La crescita della letteratura biomedica

    Ulrich's International Periodicals Directory
    228.446 periodici
    52.137 periodici cessati
    29.576 periodici di cui non si conosce lo stato (se attivo o cessato).
    146.733 periodici attivi, alla data del marzo 1999,

    di cui solo 122.430 nello stato dichiarato "active",
    sono muniti di campi "data di pubblicazione"
    l'analisi sulla crescita incrementale
    si è potuta condurre solo su questa parte di periodici attivi
    e non su tutto l'insieme dei 146.733

    10.277 i periodici di ambito strattamente medico

     repertorio a carattere generale
    non esaustivo per l'ambito disciplinare biomedico in esame

     utilizzato come punto di riferimento ai fini del calcolo sulla crescita generale dei periodici,
    nel corso degli ultimi decenni,
    al fine di ottenere un dato più generale di contesto:
    numero dei periodici in generale,
    ad oggi, si è triplicato rispetto al 1970
     
     


     
     

    SERLINE
    della National Library Medicine di Bethesda,
    raccoglie tutti i periodici della biblioteca nazionale statunitense
    produce anche la base dati biografica medica MEDLINE.
    SERLINE contiene 89.501 periodici di ambito biomedico,
    indicizzati sia da MEDLINE che da altri database di settore,
    oppure non indicizzati da nessun repertorio.
    60.506 periodici "spenti" o assorbiti da altri o che hanno cambiato titolo
    I periodici attivi correnti di biomedicina sono 28.995 al dicembre 1998.
    Di questi 6162 sono indicizzati da MEDLINE e da EMBASE
     
     




    L'indicizzazione dei periodici biomedici effettuata da
    MEDLINE, EMBASE e PASCAL Biomed


    TOTALE RIVISTE CORRENTI 
    DI AMBITO BIOMEDICO
    28995

    8800 riviste sono indicizzate solo dalle quaranta banche dati del Progetto MEDLARS


     
    RIVISTE CORRENTI INDICIZZATE DA MEDLINE
    4592
    Di cui di INFERMIERISTICA
    384
    Di cui di ODONTOIATRIA
    501
    Di cui di ONCOLOGIA
    189

     
    RIVISTE CORRENTI INDICIZZATE DA EMBASE
    4168
    Di cui di INFERMIERISTICA (anche in MEDLINE)
    29
    Di cui di ODONTOIATRIA (anche in MEDLINE)
    26
    Di cui di ONCOLOGIA (anche in MEDLINE)
    180

     
    RIVISTE INDICIZZATE IN TOTALE DAI SUE DATABASE MEDLINE E EMBASE
    6162

     
    RIVISTE INDICIZZATE IN COMUNE TRA I DUE DATABASE (SOVRAPPOSIZIONE)
    2598

     
    RIVISTE CORRENTI INDICIZZATE DA PASCAL Biomed
    6885


    Numero di riviste indicizzate dai tre database bibliografici:
    MEDLINE, EMBASE, PASCAL Biomed, suddivisi per Paese europeo.



    Vi sono due linee da considerare circa le pubblicazioni quale prodotto della ricerca di ogni singolo Paese:


     
    PAESE

    EUROPA

    MEDLINE
    EMBASE
    PASCAL BIOMED
    Austria
    21
    21
    17
    Belgio
    28
    21
    120
    Bosnia Erzeg.
    2
    1
    0
    Bulgaria
    9
    17
    4
    Croazia
    11
    22
    4
    Danimarca
    76
    44
    70
    Finlandia
    14
    5
    13
    Francia
    138
    159
    1791
    Germania
    278
    297
    513
    Gran Bretagna
    675
    697
    997
    Grecia
    12
    11
    2
    Italia
    139
    175
    103
    Iugoslavia
    8
    4
    1
    Liechtestein
    0
    0
    1
    Lussemburgo
    1
    1
    7
    Macedonia
    1
    0
    0
    Monaco
    1
    0
    1
    Norvegia
    34
    29
    18
    Olanda
    168
    208
    359
    Polonia
    59
    36
    14
    Portogallo
    7
    10
    5
    Rep. Ceca
    40
    31
    16
    Romania
    14
    11
    4
    Russia
    72
    41
    25
    Slovacchia
    3
    9
    1
    Slovenia
    2
    3
    0
    Spagna
    53
    86
    53
    Svezia
    25
    17
    52
    Svizzera
    165
    144
    260
    Turchia
    8
    36
    0
    Ucraina
    11
    5
    2
    Ungheria
    12
    12
    0
    TOTALE EUROPEE
    2087
    2153
    4453

     

    SOLO BLOCCO GRAN BRETAGNA
     
     

    GRAN
    BRETAGNA e IRLANDA NORD
    MEDLINE
    EMBASE
    PASCAL BIOMED
    Scozia
    26
    32
    0
    Galles
    0
    0
    0
    Irlanda

    con Irl. Nord

    48
    45
    14
    Inghilterra
    601
    620
    983
    Totale Gran Bretagna
    675
    697
    997

    NESSUNA RIVISTA INDICIZZATA DA NESSUNO DEI TRE DATABASE IN ESAME PER I SEGUENTI PAESI EUROPEI:

    ALBANIA
    GALLES
    ISLANDA
    LITUANIA
    MALTA
    MOLDAVIA
     


    ANALISI DETTAGLIATA RELATIVA A QUATTRO PAESI EUROPEI: GRAN BRETAGNA, FRANCIA, ITALIA E GERMANIA
    PER I TRE DATABASE IN ESAME: MEDLINE, EMBASE, PASCAL BIOMED, CON VALUTAZIONE COMPARATIVA TRA MEDLINE E EMBASE


    PAESE
    MEDLINE
     
     

    (1)

    EMBASE
     
     

    (2)

    Somma
    MED+EMB

    (3)

    Sovrapp. MED/EMB

    (4)

    Solo MED
    senza EMB

    (5)

    Solo EMB
    senza MED

    (6)

    PASCAL BIOMED

    (7)

    Gran Bretagna e Iralnda Nord
    675
    697
    897
    475
    200
    222
    997
    Francia
    138
    159
    210
    87
    51
    72
    1791
    Italia (*)
    139
    175
    233
    81
    58
    94
    103
    Germania
    278
    297
    397
    178
    100
    119
    513

    (*) le riviste in lingua italiana indicizzate sono 189 (MEDLINE 111 e EMBASE 137)
     
     

    AMBITO GEOGRAFICO
    MEDLINE
     
     

    (1)

    EMBASE
     
     

    (2)

    Somma
    MED+EMB

    (3)

    Sovrapp. MED/EMB

    (4)

    Solo MED
    senza EMB

    (5)

    Solo EMB
    senza MED

    (6)

    PASCAL BIOMED

    (7)

    EUROPA
    2087
    2153
    2927
    1313
    774
    840
    4453
    Stati Uniti
    1790
    1413
    2200
    1003
    787
    410
    1777
    Canada
    68
    44
    86
    26
    42
    18
    103
    Cina
    53
    30
    73
    10
    43
    20
    18
    Giappone
    224
    221
    328
    117
    107
    104
    40
    Australia
    51
    47
    74
    24
    27
    23
    142
    Altri PAESI
    (Americhe, Africa, Oriente)
    319
    260
    474
    105
    214
    155
    352
    TOTALE
    4592
    4168
    6162
    2598
    1994
    1570
    **6885

    (**)Le 6885 riviste coperte da PASCAL Biomed, recuperate dal sito Web dell'INIST si riferiscono a oltre 3500 biomediche indicizzate cover-to-cover (tutta la rivista), e per le restanti si tratta delle riviste coperte da PASCAL, indicizzate in modo selettivo da PASCAL Biomed

    (1) riviste indicizzate dal database MEDLINE: è composto dalla somma di (4) riviste comuni in sovrapposizione e (5) riviste indicizzate solamente da MEDLINE

    (2) riviste indicizzate dal database EMBASE: è composto dalla somma di (4) riviste comuni in sovrapposizione e (6) riviste indicizzate solamente da EMBASE

    (3) è il risultato di (1) e (2) combinati in .OR.: sono tutte le riviste indicizzate da entrambi i database MEDLINE e EMBASE nei loro insiemi separati, ma messi assieme. E' anche la somma di (4) (5) (6)

    (4) è il risultato di (1) e (2) combinati in .AND.: sono le riviste indicizzate in comune dai database MEDLINE e EMBASE, dunque le sovrapposizioni

    (5) riviste indicizzate solo dal dal database MEDLINE e non da EMBASE

    (6) riviste indicizzate solo dal dal database EMBASE e non da MEDLINE

    (7) riviste indicizzate da PASCAL BIOMED (non effettuate ricerche incrociate con gli altri due database)
     


    Conclusioni



     
     

    PAESE
    Sovrapp. MED/EMB

    %

    Solo MED
    senza EMB

    %

    Solo EMB
    senza MED

    %

    Gran Bretagna e Irlanda Nord
    52.9
    22.2
    24.8
    Francia
    41.4
    24.3
    34.3
    Italia (*)
    34.7
    24.9
    40.4
    Germania
    44.9
    25.1
    30.0

     

    E' evidente che la sovrapposizione per l'ambito europeo tra MEDLINE e EMBASE è piuttosto rilevante (44.8%) e che l'area scoperta, risulta ben equilibrata tra i due database (26.5% e 28.7%).

    La sovrapposizione è ulteriormente accentuata per le pubblicazione anglossassoni che arriva al 52.9%. Francia e Germania si mantengono all'interno dei valori della media europea, mentre l'Italia risulta coperta meglio da EMBASE (40.4%) rispetto al solo MEDLINE (24.9%).
     
     

    AMBITO GEOGRAFICO
    Sovrapp. MED/EMB

    %

    Solo MED
    senza EMB

    %

    Solo EMB
    senza MED

    %

    EUROPA
    44.8
    26.5
    28.7
    Stati Uniti
    45.5
    35.8
    18.7
    Canada
    30.2
    48.9
    20.9
    Cina
    13.6
    59.0
    27.4
    Giappone
    35.6
    32.7
    31.7
    Australia
    32.4
    36.4
    31.2
    Altri PAESI
    (Americhe, Africa, Oriente)
    22.1
    45.2
    32.7
    TOTALE
    42.2
    32.3
    25.5

    la sovrapposizione totale
    copertura dei periodici tra
    MEDLINE e EMBASE
    raggiunge il 42.2%.
    Insieme coprono
    una parte rilevante
    di letteratura biomedica internazionale.

    EMBASE è complementare a MEDLINE

    PASCAL Biomed copre una buona parte della letteratura europea
    con particolare riguardo a Francia, ma anche Gran Bretagna e Germani

     la letteratura medica italiana
    non è sufficientemente rappresentata
    da nessuno database presi in esame

    Le potenzialità di EMBASE non risultano essere sfruttate appieno sia in quanto non sufficientemente conosciute dai ricercatori in generale sia perché è uno strumento non molto diffuso. La scarsa diffusione potrebbe essere una delle ragioni dell'alto costo di questo database, rispetto ad altri: più la base di acquisto si allarga e più i costi si abbassano.

    Una comparazione più accurata dei prodotti che presentano i database di settore biomedico, deve tener conto oltre che degli aspetti inerenti alla struttura del datababase, dei record, della presenza o meno di tesauro, anche a parità di condizioni (stesso supporto, stessa interfaccia e stesso software di recupero dell'informazione), degli aspetti connessi alla copertura temporale.

    Le differenze che si possono desumere da una simile comparazione possono risultare significative anche per un più corretto utilizzo da parte dell'utenza, soprattutto specialistica.


     
    Bibliografia

    copyright Antonella De Robbio, 11 aprile 1999