AIDA Informazioni |
ISSN 1121-0095, trimestrale
anno 17, numero 3-4, luglio-dicembre 1999 |
La sfida non era nuova ed i maggiori produttori di search engine la conoscevano bene. Questo la rendeva particolarmente difficile e richiedeva soluzioni radicalmente innovative sul piano tecnologico e delle scelte strategiche: costruire un prodotto unico per velocità e funzionalità, e completamente automatico. Al suo esordio nel maggio scorso FAST Search si presenta con un database di oltre 80 milioni di documenti ricercabili che, se non è ancora la collezione più vasta in quanto il primato è ancora di Northern Light con i suoi 150 milioni di documenti, si avvia comunque ad esserlo ponendosi l'obiettivo dei 200 milioni per la fine dellíestate (secondo studi compiuti dalla Forrest Research si può calcolare in una cifra oscillante fra i 500 e i 600 milioni la massa dei documenti circolanti nel mondo web). Sicuramente fin da adesso può vantare, se non il primato sul numero dei documenti disponibili, quello sulla rapidità di risposta e di download, anche di immagini: in pochi secondi si hanno risposte che contemplano anche alcune migliaia di segnalazioni.
L'interfaccia di ricerca si presenta all'utente in maniera particolarmente amichevole con tutte le consuete possibilità di ricerca che ci si aspetta di trovare, anzi con in più la possibilità di lavorare su tutto l'universo delle parole conosciute, senza stopwords. La differenza sta dietro le quinte, in un'architettura di sistema che ottiene il superamento dell'equazione per cui al crescere della massa di documenti indagati si abbassa il tasso di efficienza e rapidità del sistema e viceversa tale tasso aumenta al diminuire del numero dei documenti contenuti nel database. Il FAST Search Server sembra aver superato tale ostacolo, grazie in particolare allíutilizzo dei Pattern Matching Chip (PMC), processori che consentono di ricercare e filtrare grandi quantità di informazioni, ben oltre il risultato che può essere ottenuto con qualunque software, in quanto la velocità di ricerca è indipendente dalla complessità della domanda. Particolarmente utili si rivelano in tutte quelle ricerche in cui meno efficienti sono i software, per esempio in caso di incerto spelling. I dati vengono scaricati nella RAM del server, indagati con il PMC e immediatamente viene reso noto il risultato. Cíè da notare infine che tutto il sistema si regge su PC Intel, fatto questo che rende agevole e non costosa ogni necessaria espansione. Architettura di sistema quindi basata sulla capacità di gestire senza penalizzazioni in termini di rapidità quantità di dati crescenti e bassi costi di gestione dovuti alla struttura basata sull'informatica distribuita sono le caratteristiche che la stessa FAST presenta come principali del suo motore di ricerca.
Ad esso si collegano poi FAST FTP Search in collaborazione con Lycos con un indice di circa 105 milioni di files prelevati da più di 7000 siti nel mondo. La Fast dichiara che le richieste giornaliere ammontano approssimativamente ad 1 milione e 25 mila. La ricerca avviene non soltanto nelle pagine web, ma anche direttamente nei siti ftp, può essere condotta sia attraverso il nome del file ricercato, sia attraverso metadati di descrizione.
Infine per quanto attiene la possibilità di scaricare rapidamente immagini, la FAST ha prodotto un software proprietario per la compressione: usando FAST Image Transfer Adobe Photoshop plug-in, le immagini possono essere convertite nel formato .fst e successivamente decompresse e visualizzate dall'utente attraverso FAST Image Transfer Java applet decoder. La ditta produttrice sostiene che i file di immagini così compressi sono dalle 2 alle 6 volte più piccoli degli analoghi in formato .jpeg ed anche 10 volte inferiori a quelli in formato .gif. Da qui discende ovviamente la velocità di trasferimento delle immagini fisse e in movimento.
Sperimentando il prodotto, si può sottoscrivere l'opinione espressa alla sua uscita in un articolo del 4 maggio scorso su The Search Engine Report [searchenginewatch.internet.com/sereport/99/05-fast.html] di un grande sforzo verso il raggiungimento della copertura più ampia possibile a scapito, per il momento, della rilevanza e senza aver risolto il problema dei duplicati. La consueta forbice fra quantità e qualità dellíinformazione non sembra ancora ricomposta, mentre risultati senz'altro in linea con le aspettative si ottengono in termini di velocità di risposta. Sicuramente però non è pensabile che la soluzione anche di questa dicotomia non sia nei piani della FAST e infatti sempre nellíarticolo sopra citato David Burns, Presidente dalla filiale statunitense della FAST Search &Transfer , riferendosi proprio a paragoni con altri motori di ricerca, maggiormente impegnati sul piano della ricerca della rilevanza, afferma di lanciare una sfida ai concorrenti anche su questo piano: "d'altra parte" sostiene "non possiamo proporre buoni siti se non li abbiamo nel nostro database" giustificando così la necessità di una raccolta quanto più massiccia possibile.
Líinsieme delle attività della FAST la collocano
in una posizione di eccellenza nel campo delle tecnologie innovative per
il reperimento dellíinformazione e il trasferimento di files, siano essi
testi, immagini o suoni (attraverso mp3.lycos.com
si propone un motore di ricerca apposito per i files musicali che ha gli
stessi obiettivi di completezza del motore di ricerca). Un vero e proprio
sistema di ricerca integrato che, attuando proficue strategie di collaborazione
con altri colossi del settore (alla prima con Lycos altre dovrebbero succederne),
punta allo sviluppo e perfezionamento dei search engine per poterli poi
proporre all'acquisto di gestori di servizi di informazione.