di Antonella
De Robbio
<mailto:derobbio@math.unipd.it>
Scopi e obiettivi della ricerca
comparazione tra i tre maggiori
database bibliografici
di ambito biomedico
MEDLINE EMBASE PASCAL
Biomed
rilevazione delle coperture dei periodici indicizzati :
Obiettivo principale dell'indagine
fornire uno strumento informativo
di supporto per orientare sulle
scelte
utile alle valutazioni per l'acquisizione
di banche dati del settore
Utenza a cui è rivolto lo studio
Tools utilizzati
6 database
tutte in versioni su Cd-Rom per il Sistema di Database Networking ERL (Electronic Reference Library) della Silver Platter, con software di recupero dell'informazione SPIRS, interrogate sia con connessione via client su workstation per ambiente operativo Windows (WinSpirs) sia in accesso via Rete attraverso interfaccia WebSPIRS
· quelli utilizzati quale strumento informativo di indagine, due database di periodici:
tecniche di information retrieval
sulle banche dati di periodici
liste dei periodici indicizzati
relative alle singole basi di dati recuperate dal Web
·crescita
relativa agli ultimi dieci anni dei periodici di ambito biomedico
·
numero
dei periodici correnti indicizzati in relazione ai periodici biomedici
totali e in relazione ai periodici esistenti in generale
·
numero
dei periodici correnti indicizzati da ciascun database e loro suddivisione
per paese di pubblicazione
·
comparazione
relativa alla copertura dei periodici relativamente a sovrapposizioni tra
database e tra aree geografiche
Le basi di dati differiscono
strutturalmente in riferimento a più fattori:
· esistenza di più versioni/edizioni della banca dati anche per stessa titpologia di supporto (parti di database selezionate in base a periodi o ambiti specializzati)
· versioni con aggiornamenti differenti (CD-Rom con aggiornamenti semestrali, trimestrali, mensili )
· riferimenti temporali differenti (copertura del database parziale o totale)
· interfaccia e linguaggio di interrogazione
Schede informative sulle basi di dati utilizzate per la presente ricerca
Analisi comparativa della struttura dei database
|
bibliografiche |
|
|
record (limit) |
|
|
MEDLINE Advanced | 9 milioni
(dal 1966) |
Oltre 400.000 | 68%
(dal 1975) |
33 (12)
TAG |
MesH
18.000 intestazioni |
4592 |
EMBASE | 7 milioni
(dal 1974) |
Oltre 400.000 | 80% | 41 (13)
EMTAG |
EMTREE
37.000 termini: medici e sostanze |
4168 |
PASCAL
Biomed
Tratta da PASCAL
|
2.600.000
(dal 1996
|
Oltre 400.000 | In inglese
In francese |
42 (9) | Ricerca su campi
Descrittori, non da Thesauro 80.000 termini
|
6885
(di cui cover-to-cover
|
EMBASE più strutturato:
41 campi, rispetto a MEDLINE con 33 campi
EMBASE comprende vari campi relativi alle sostanze
e ai farmaci,
nome della sostanza, ditta produttrice, classificazione
della sostanza,
descrittore della sostanza, sequenza molecolare, ...
PASCAL Biomed 42 campi per record, triplicazione
dei campi DE (descrittori) e identificatori, riportati in tre lingue diverse.
Current Contents 45 campi per record.
EMBASE e MEDLINE 15 campi in comune,
con stessa etichetta e stesso significato relativamente
al contenuto del campo;
la sovrapposizione con PASCAL Biomed e gli altri due
database è di 8 campi.
In sette casi stessa etichetta di campo per significati diversi e in questi casi sarà necessario prestare attenzione in fase di una ricerca comune su più database.
EMBASE 13 campi limite,
MEDLINE 12 campi limite
PASCL Biomed 9 campi limite,
sovrapposizione mista per alcuni campi
Tabella comparativa dei campi
record dei quattro database: MEDLINE, EMBASE, Current Contents e PASCAL
Biomed
AB | Abstract | MED | EMB | CC | PASC Biom |
AD | Indirizzo dell'Autore | MED | EMB | CC
*** |
|
AF | Ente in cui l'Autore afferisce | PASC Biom | |||
AGE | TAG Età | MED | |||
AI | Indicatore presenza di Abstract | MED | CC | PASC Biom | |
AN | Numero identificativo del documento | MED | EMB | CC | PASC Biom |
AU | Autore (CA e PA) | MED | EMB | CC | PASC Biom |
AUZ | Insieme dei campi autore | CC
*** |
|||
BA | Autore del volume | CC | |||
BL | Livello bibliografico | PASC Biom | |||
BT | Titolo del libro | EMB | CC | ||
CA | Ente Autore | CC | PASC Biom | ||
CC | Sezione del Current Contents | CC
* |
|||
CD | Data e luogo del congresso (per i record dal
1990)
CODICE |
EMB |
PASC Biom |
||
CF | Nome del congresso (dal 1990) | EMB | PASC Biom | ||
CM | Commento | MED | |||
CN | Numero del contratto o della sovvenzione | MED | CC | ||
CO | Codice identificativo della rivista | EMB | |||
CP | Paese di pubblicazione | MED | EMB | PASC Biom | |
CR | Informazioni sul Copyright | CC | PASC Biom | ||
CT | Titolo del congresso (dal 1990) | EMB | |||
DA | Data di ingresso | MED | |||
DE | Descrittori (Medical Index Term)
(DEE, DEF, DES) |
EMB | PASC Biom | ||
DEE | Descrittori MIT in Inglese | PASC Biom | |||
DEF | Descrittori MIT in Francese | PASC Biom | |||
DES | Descrittori MIT in Spagnolo | PASC Biom | |||
DG | Data Academic Degree | PASC Biom | |||
DM | Nome della sostanza prodotta | EMB | |||
DN | Nome della marca del prodotto | EMB | |||
DT | Tipologia del documento | EMB | CC | ||
DR | Descrittore della sostanza | EMB | |||
EC | Classificazione EMCLAS | EMB | |||
ED | Editore/i | EMB | CC | ||
EL | Classificazione EMCLAS della sostanza | EMB | |||
EM | EMTAGS, concetti generali di indicizzazione
Indirizzo e-mail (posta elettronica) |
EMB |
CC |
||
EML | Indirizzo e-mail (posta elettronica) | EMB | |||
GA | Numero identificativo dell'articolo | CC | |||
GS | Simbolo del gene | MED | |||
IB | International Standard Book Number | CC | PASC Biom | ||
ID | Identificatori (IDE, IDF, IDS) | PASC Biom | |||
IDE | Identificatori Inglese | PASC Biom | |||
IDF | Identificatori Francese | PASC Biom | |||
IDS | Identificatori Spagnolo | PASC Biom | |||
IN | Istituzione Ricerca | CC | |||
IS | International Standard Serial Number
ISBN/ISSN |
EMB | CC | PASC Biom | |
ISSN | International Standard Serial Number | MED | |||
JC | Categoria del periodico | MED | |||
JI | Fascicolo della rivista (table of contents) | CC | |||
JN | Abbreviazione del titolo della rivista
Nome del periodico |
MED | CC
** |
PASC Biom | |
JS | Categoria/soggetto del periodico | CC | |||
KA | Chiavi assegnate dall'autore | CC | |||
KP | Chiavi Plus assegnate dall'ISI | CC | |||
KW | Insieme delle chiavi KA e KP | CC
*** |
|||
LA | Lingua originale del documento | MED | EMB | CC | PASC Biom |
LC | Numero Library of Congress | CC | |||
LOC | Localizzazione del documento primario | PASC Biom | |||
LS | Lingua/e del Sommario | EMB | PASC Biom | ||
LT | Tipo di letteratura | PASC Biom | |||
MA | Numero di abstract della conferenza | CC | PASC Biom | ||
MESH | Termini del vocabolario controllato o titolo degli argomenti | MED | |||
MIME | Termini del vocabolario controllato o titolo degli argomenti minori | MED | |||
MJME | Termini del vocabolario controllato o titolo degli argomenti maggiori | MED | |||
MN | Ditta produttrice del farmaco o sostanza | EMB | |||
MS | Sequenza molecolare | EMB | |||
MT | Tipo di contenuto del documento (natura o tipologia) | PASC Biom | |||
NM | Nome della sostanza | MED | |||
NR | Numero degli articoli (table of contents)
Numero di referenze |
CC | PASC Biom | ||
NT | Notes | PASC Biom | |||
OR | Informazioni per l'ordine del volume | CC | |||
PA | Autore personale | PASC Biom | |||
PB | Editore del libro | EMB | |||
PD | Descrizione fisica | CC | |||
PI | Identificatore del pubblicatore | EMB | |||
PS | Nome personale come soggetto | MED | |||
PT | Tipo di pubblicazione | MED | EMB | CC | PASC Biom |
PU | Editore | PASC Biom | |||
PY | Anno di pubblicazione
(LT e MT) |
MED | EMB | CC | PASC Biom |
RAP | Request-A-Print | CC
** |
|||
RF | Numero dei riferimenti bibliografici | MED | EMB | CC | |
RL | Lingua del documento a cui si riferisce la recensione/revisione | CC | |||
RN | Numero assegnato alle sostanze chimiche o agli enzimi (CAS) | MED | EMB | ||
RP | Numero di Report
Autore cui si mandano richieste di estratti |
EMB* | CC | ||
RPT | Informazioni sul Report | PASC Biom | |||
RT | Tipo di record | CC | |||
RW | Autore del documento a cui si riferisce la recensione/revisione | CC | |||
RY | Anno di pubblicazione del documento a cui si riferisce la recensione/revisione | CC | |||
SB | Subset | MED | |||
SC | Identificatore periodico | MED | |||
SE | Titolo della collezione | CC | |||
SH | SubHeading MESH | MED | |||
SI | Abbrevizione della banca dati in cui è
registrata una sequenza molecolare
Fonte dell'indicizzazione |
MED |
PASC Biom |
||
SN | Nome dell'Ente Universitario o Scuola | PASC Biom | |||
SO | Fonte della citazione bibliografica | MED | EMB | CC | PASC Biom |
SU | Soggetto | EMB
*** |
|||
TG | Checktags (speciali descrittori) | MED | EMB | ||
TI | Titolo
Titolo (T1 e TT) |
MED | EMB | CC | PASC Biom |
T1 | Titolo originale | PASC Biom | |||
TIZ | Insieme dei campi titolo | CC
*** |
|||
TN | Nome depositato
Numero ufficiale tesi |
EMB | PASC Biom | ||
TO | Titolo originale non in inglese) | MED | EMB | ||
TS | Titoli | EMB
*** |
|||
TT | Titolo tradotto | PASC Biom | |||
UD | Codice di aggiornamento | MED | EMB | CC | |
XID | Numero del record in ADONIS (solo per il periodo
1991-93)
(La base dati Adonis contiene dati bibliografici full-text) |
EMB
* |
* i campi non sono ricercabili, ma solo visualizzabili
** i campi non sono nè ricerbali, nè
visualizzabili, servono unicamente per downloading o per document delivery
*** i campi sono unicamente ricercabili, ma non visualizzabili
(set di campi ricercabili assieme)
differenze tra
MEDLINE ed EMBASE
rilevate da
Greenhalgh , nel 1997
British medical Journal,
periodo luglio-agosto 1996.
la metodologia utilizzata deve tener conto di più fattori:
Gli argomenti/query posti
si sono riferiti a:
Queste peculiarità permettono di reperire
informazioni rilevanti per esempio per il campo della Medicina
Basata sulle Evidenze, laddove si possono trasversalmente settorializzare
tutti gli articoli solo di ambito clinico, oppure tutti quelli con TAG
"human" e, nel caso di applicazioni terapeutiche, limitare a campi TAG
"Age", per fasce di età.
La crescita della letteratura biomedica
Ulrich's International Periodicals
Directory
228.446 periodici
52.137 periodici cessati
29.576 periodici di cui non
si conosce lo stato (se attivo o cessato).
146.733 periodici attivi, alla
data del marzo 1999,
di cui solo 122.430 nello stato dichiarato "active",
sono muniti di campi "data di pubblicazione"
l'analisi sulla crescita incrementale
si è potuta condurre solo su questa parte di
periodici attivi
e non su tutto l'insieme dei 146.733
10.277 i periodici di ambito strattamente medico
repertorio a carattere
generale
non esaustivo per l'ambito disciplinare
biomedico in esame
utilizzato come punto di riferimento ai fini
del calcolo sulla crescita generale dei periodici,
nel corso degli ultimi decenni,
al fine di ottenere un dato più generale di
contesto:
numero dei periodici in generale,
ad oggi, si è triplicato
rispetto al 1970
SERLINE
della National Library Medicine
di Bethesda,
raccoglie tutti i periodici
della biblioteca nazionale statunitense
produce anche la base dati biografica
medica MEDLINE.
SERLINE contiene 89.501
periodici di ambito biomedico,
indicizzati sia da MEDLINE che
da altri database di settore,
oppure non indicizzati da nessun
repertorio.
60.506 periodici "spenti" o
assorbiti da altri o che hanno cambiato titolo
I periodici attivi correnti
di biomedicina sono 28.995 al dicembre 1998.
Di questi 6162 sono indicizzati
da MEDLINE e da EMBASE
L'indicizzazione dei periodici
biomedici effettuata da
MEDLINE, EMBASE e PASCAL Biomed
TOTALE
RIVISTE CORRENTI
DI AMBITO BIOMEDICO |
28995
|
8800 riviste sono indicizzate solo dalle quaranta banche dati del Progetto MEDLARS
RIVISTE CORRENTI INDICIZZATE DA MEDLINE |
4592
|
Di cui di INFERMIERISTICA |
384
|
Di cui di ODONTOIATRIA |
501
|
Di cui di ONCOLOGIA |
189
|
RIVISTE CORRENTI INDICIZZATE DA EMBASE |
4168
|
Di cui di INFERMIERISTICA (anche in MEDLINE) |
29
|
Di cui di ODONTOIATRIA (anche in MEDLINE) |
26
|
Di cui di ONCOLOGIA (anche in MEDLINE) |
180
|
RIVISTE INDICIZZATE IN TOTALE DAI SUE DATABASE MEDLINE E EMBASE |
6162
|
RIVISTE INDICIZZATE IN COMUNE TRA I DUE DATABASE (SOVRAPPOSIZIONE) |
2598
|
RIVISTE CORRENTI INDICIZZATE DA PASCAL Biomed |
6885
|
Numero di riviste indicizzate
dai tre database bibliografici:
MEDLINE, EMBASE, PASCAL Biomed,
suddivisi per Paese europeo.
Vi sono due linee da considerare circa le pubblicazioni quale prodotto della ricerca di ogni singolo Paese:
EUROPA |
|
|
|
Austria |
21
|
21
|
17
|
Belgio |
28
|
21
|
120
|
Bosnia Erzeg. |
2
|
1
|
0
|
Bulgaria |
9
|
17
|
4
|
Croazia |
11
|
22
|
4
|
Danimarca |
76
|
44
|
70
|
Finlandia |
14
|
5
|
13
|
Francia |
138
|
159
|
1791
|
Germania |
278
|
297
|
513
|
Gran Bretagna |
675
|
697
|
997
|
Grecia |
12
|
11
|
2
|
Italia |
139
|
175
|
103
|
Iugoslavia |
8
|
4
|
1
|
Liechtestein |
0
|
0
|
1
|
Lussemburgo |
1
|
1
|
7
|
Macedonia |
1
|
0
|
0
|
Monaco |
1
|
0
|
1
|
Norvegia |
34
|
29
|
18
|
Olanda |
168
|
208
|
359
|
Polonia |
59
|
36
|
14
|
Portogallo |
7
|
10
|
5
|
Rep. Ceca |
40
|
31
|
16
|
Romania |
14
|
11
|
4
|
Russia |
72
|
41
|
25
|
Slovacchia |
3
|
9
|
1
|
Slovenia |
2
|
3
|
0
|
Spagna |
53
|
86
|
53
|
Svezia |
25
|
17
|
52
|
Svizzera |
165
|
144
|
260
|
Turchia |
8
|
36
|
0
|
Ucraina |
11
|
5
|
2
|
Ungheria |
12
|
12
|
0
|
TOTALE EUROPEE |
2087
|
2153
|
4453
|
SOLO BLOCCO GRAN BRETAGNA
BRETAGNA e IRLANDA NORD |
|
|
|
Scozia |
26
|
32
|
0
|
Galles |
0
|
0
|
0
|
Irlanda
con Irl. Nord |
48
|
45
|
14
|
Inghilterra |
601
|
620
|
983
|
Totale Gran Bretagna |
675
|
697
|
997
|
NESSUNA RIVISTA INDICIZZATA DA NESSUNO DEI TRE DATABASE IN ESAME PER I SEGUENTI PAESI EUROPEI:
ALBANIA
GALLES
ISLANDA
LITUANIA
MALTA
MOLDAVIA
ANALISI DETTAGLIATA RELATIVA
A QUATTRO PAESI EUROPEI: GRAN BRETAGNA, FRANCIA, ITALIA E GERMANIA
PER I TRE DATABASE IN ESAME:
MEDLINE, EMBASE, PASCAL BIOMED, CON VALUTAZIONE COMPARATIVA TRA MEDLINE
E EMBASE
|
(1) |
(2) |
MED+EMB (3) |
(4) |
senza EMB (5) |
senza MED (6) |
(7) |
Gran Bretagna e Iralnda Nord |
675
|
697
|
897
|
475
|
200
|
222
|
997
|
Francia |
138
|
159
|
210
|
87
|
51
|
72
|
1791
|
Italia (*) |
139
|
175
|
233
|
81
|
58
|
94
|
103
|
Germania |
278
|
297
|
397
|
178
|
100
|
119
|
513
|
(*) le riviste in lingua italiana
indicizzate sono 189 (MEDLINE 111 e EMBASE 137)
|
(1) |
(2) |
MED+EMB (3) |
(4) |
senza EMB (5) |
senza MED (6) |
(7) |
|
EUROPA |
2087
|
2153
|
2927
|
1313
|
774
|
840
|
4453
|
|
Stati Uniti |
1790
|
1413
|
2200
|
1003
|
787
|
410
|
1777
|
|
Canada |
68
|
44
|
86
|
26
|
42
|
18
|
103
|
|
Cina |
53
|
30
|
73
|
10
|
43
|
20
|
18
|
|
Giappone |
224
|
221
|
328
|
117
|
107
|
104
|
40
|
|
Australia |
51
|
47
|
74
|
24
|
27
|
23
|
142
|
|
Altri PAESI
(Americhe, Africa, Oriente) |
319
|
260
|
474
|
105
|
214
|
155
|
352
|
|
TOTALE |
4592
|
4168
|
6162
|
2598
|
1994
|
1570
|
**6885
|
(**)Le 6885 riviste coperte da PASCAL Biomed, recuperate dal sito Web dell'INIST si riferiscono a oltre 3500 biomediche indicizzate cover-to-cover (tutta la rivista), e per le restanti si tratta delle riviste coperte da PASCAL, indicizzate in modo selettivo da PASCAL Biomed
(1) riviste indicizzate dal database MEDLINE: è composto dalla somma di (4) riviste comuni in sovrapposizione e (5) riviste indicizzate solamente da MEDLINE
(2) riviste indicizzate dal database EMBASE: è composto dalla somma di (4) riviste comuni in sovrapposizione e (6) riviste indicizzate solamente da EMBASE
(3) è il risultato di (1) e (2) combinati in .OR.: sono tutte le riviste indicizzate da entrambi i database MEDLINE e EMBASE nei loro insiemi separati, ma messi assieme. E' anche la somma di (4) (5) (6)
(4) è il risultato di (1) e (2) combinati in .AND.: sono le riviste indicizzate in comune dai database MEDLINE e EMBASE, dunque le sovrapposizioni
(5) riviste indicizzate solo dal dal database MEDLINE e non da EMBASE
(6) riviste indicizzate solo dal dal database EMBASE e non da MEDLINE
(7) riviste
indicizzate da PASCAL BIOMED (non effettuate ricerche incrociate
con gli altri due database)
Conclusioni
|
% |
senza EMB % |
senza MED % |
Gran Bretagna e Irlanda Nord |
52.9
|
22.2
|
24.8
|
Francia |
41.4
|
24.3
|
34.3
|
Italia (*) |
34.7
|
24.9
|
40.4
|
Germania |
44.9
|
25.1
|
30.0
|
E' evidente che la sovrapposizione per l'ambito europeo tra MEDLINE e EMBASE è piuttosto rilevante (44.8%) e che l'area scoperta, risulta ben equilibrata tra i due database (26.5% e 28.7%).
La sovrapposizione è ulteriormente accentuata
per le pubblicazione anglossassoni che arriva al 52.9%. Francia e Germania
si mantengono all'interno dei valori della media europea, mentre l'Italia
risulta coperta meglio da EMBASE (40.4%) rispetto al solo MEDLINE (24.9%).
|
% |
senza EMB % |
senza MED % |
||
EUROPA |
44.8
|
26.5
|
28.7
|
||
Stati Uniti |
45.5
|
35.8
|
18.7
|
||
Canada |
30.2
|
48.9
|
20.9
|
||
Cina |
13.6
|
59.0
|
27.4
|
||
Giappone |
35.6
|
32.7
|
31.7
|
||
Australia |
32.4
|
36.4
|
31.2
|
||
Altri PAESI
(Americhe, Africa, Oriente) |
22.1
|
45.2
|
32.7
|
||
TOTALE |
42.2
|
32.3
|
25.5
|
la sovrapposizione totale
copertura dei periodici tra
MEDLINE e EMBASE
raggiunge il 42.2%.
Insieme coprono
una parte rilevante
di letteratura biomedica internazionale.
EMBASE è complementare a MEDLINE
PASCAL Biomed copre una buona
parte della letteratura europea
con particolare riguardo a Francia,
ma anche Gran Bretagna e Germani
la letteratura medica italiana
non è sufficientemente
rappresentata
da nessuno database presi in
esame
Le potenzialità di EMBASE non risultano essere sfruttate appieno sia in quanto non sufficientemente conosciute dai ricercatori in generale sia perché è uno strumento non molto diffuso. La scarsa diffusione potrebbe essere una delle ragioni dell'alto costo di questo database, rispetto ad altri: più la base di acquisto si allarga e più i costi si abbassano.
Una comparazione più accurata dei prodotti che presentano i database di settore biomedico, deve tener conto oltre che degli aspetti inerenti alla struttura del datababase, dei record, della presenza o meno di tesauro, anche a parità di condizioni (stesso supporto, stessa interfaccia e stesso software di recupero dell'informazione), degli aspetti connessi alla copertura temporale.
Le differenze che si possono desumere da una simile
comparazione possono risultare significative anche per un più corretto
utilizzo da parte dell'utenza, soprattutto specialistica.
Bibliografia
copyright Antonella De Robbio,
11 aprile 1999