CAT (Curator Archiving Tool): improving access to web archives = CAT (Curator Archiving Tool): millorant l'accés als arxius web = CAT (Curator Archiving Tool): mejorando el acceso a los archivos web

Llueca, Ciro, Cócera-Saló, Daniel, Torres, Natalia, Suades Méndez, Gerard and de-la-Vega-Sivera, Ricard CAT (Curator Archiving Tool): improving access to web archives = CAT (Curator Archiving Tool): millorant l'accés als arxius web = CAT (Curator Archiving Tool): mejorando el acceso a los archivos web., 2010 (In Press) [Report]

[thumbnail of Padicat_iipc_2010_ENG.pdf]

Download (530kB) | Preview
[thumbnail of Padicat_iipc_2010_CAT.pdf]

Download (538kB) | Preview
[thumbnail of Padicat_iipc_2010_ESP.pdf]

Download (538kB) | Preview

English abstract

PADICAT is the web archive created in 2005 in Catalonia (Spain ) by the Library of Catalonia (BC ) , the National Library of Catalonia , with the aim of collecting , processing and providing permanent access to the digital heritage of Catalonia . Its harvesting strategy is based on the hybrid model ( of massive harvesting . SPA top level domain ; selective compilation of the web site output of Catalan organizations; focused harvesting of public events) . The system provides open access to the whole collection , on the Internet . We consider necessary to complement the current search for new and visualization software with open source software tool, CAT ( Curator Archiving Tool) , composed by three modules aimed to effectively managing the processes of human cataloguing ; to publish directories where the digital resources and special collections ; and to offer statistical information of added value to end users. Within the framework of the International Internet Preservation Consortium meeting ( Vienna 2010) , the progress in the development of this new tool, and the philosophy that has motivated his design, are presented to the international community.

Catalan abstract

PADICAT és l’arxiu web creat el 2005 a Catalunya (Espanya) amb l’objectiu de capturar, processar i donar accés permanent al patrimoni digital de Catalunya. Basa la seva estratègia de captura en el model híbrid (captura massiva del domini .cat; captura selectiva dels agents productors de les pàgines web catalanes; captura focalitzada d’esdeveniments públics). El sistema ofereix la seva col·lecció en obert, a Internet. Per fer-ho de manera òptima ha cregut necessari complementar els actuals programes de cerca i visualització amb una nova eina de programari lliure, CAT (Curator Archiving Tool), formada per tres mòduls orientats a gestionar eficaçment els processos de catalogació humana; publicar els recursos en directoris i centres d’interès temàtic; i oferir als usuaris informació estadística de valor afegit. En el marc de l’International Internet Preservation Consortium meeting (Viena 2010) es presenta a la comunitat internacional els avenços en la producció d’aquesta nova eina informàtica, i la filosofia que n’ha causat el disseny.

Item type: Report
Keywords: Web archives, Digital Libraries, PADICAT
Subjects: J. Technical services in libraries, archives, museum. > JH. Digital preservation.
H. Information sources, supports, channels. > HQ. Web pages.
L. Information technology and library technology > LC. Internet, including WWW.
I. Information treatment for information services > IF. Information transfer: protocols, formats, techniques.
H. Information sources, supports, channels. > HS. Repositories.
Depositing user: Ciro Llueca
Date deposited: 05 Nov 2010
Last modified: 02 Oct 2014 12:17


Webb, C. Guidelines for the Preservation of Digital Heritage. United Nations

Educational, Scientific and Cultural Organization, Paris, 2003.

Gomes, D.; Silva, M. J. “Characterizing a National Community Web”. ACM

Transactions on Internet Technology, vol 5, num 3 (Aug 2005).


Downloads per month over past year

Actions (login required)

View Item View Item