Capturing the Basque Web

Pulgar Vernalte, Francisca and Marcos Maciá, Sonia Capturing the Basque Web., 2009 . In LIDA 2009, Dubrovnik & Zadar (Croatia), 25-29 May, 2009. [Conference paper]

[thumbnail of EN_Lida_paper_Ondarenet_APA.pdf]

Download (163kB) | Preview

English abstract

Launched in 2007 by the Basque Government Department of Culture and the Basque Government IT services company, the Basque web capture project joins forces with European and international initiatives to harvest and conserve the online digital heritage. Projects launched in the mid-90s both by national libraries and private organisations and which have given an enormous boost to the development of tools and directives for conservation of the born digital heritage. In this document, we describe the setting in motion of Ondarenet (, an information system permitting collection, conservation and distribution of the Basque web. The software used for this project is the Toolkit proposed by the International Internet Preservation Consortium (IIPC). Used by most existing similar international initiatives, these open-source tools are relatively easy to install and maintain (Heritrix, NutchWAX, WebCurator and Wayback). This is an ambitious project which, like all historical archives, harnesses documents and creates collections for their custody with a view to the preservation of a country’s historical memory, a memory in this case presented in the shape of collections consisting of born-digital resources.

Spanish abstract

El proyecto de captura de la web vasca, iniciciado en el 2007 por el Departamento de Cultura del Gobierno Vasco y la Sociedad Informática del Gobierno Vasco (EJIE) se suma a las iniciativas europeas e internacionales sobre recopilación y preservación del patrimonio digital en red. Proyectos iniciados a mediados de los 90 tanto por bibliotecas nacionales como organizaciones privadas y que han supuesto un gran impulso en el desarrollo de herramientas y directrices para la preservación del patrimonio nacido en formato digital. En esta comunicación, se explica la puesta en marcha de Ondarenet ( Se trata de un sistema de información que permite recuperar, conservar y difundir la web vasca. El software utilizado para este proyecto es el Toolkit propuesto por el International Internet Preservation Consortium (IIPC). Son las herramientas utilizadas por la mayoría de las iniciativas internacionales similares existentes, relativamente fáciles de instalar y mantener, y de código abierto (Heritrix, NutchWAX, WebCurator y Wayback). Se trata en definitiva de un ambicioso proyecto, en el que como en todo archivo histórico, se recopilan documentos y se crean colecciones que se custodian para preservar la memoria histórica de un país, memoria que en este caso se presenta a través de colecciones de recursos digitales nacidos en formato digital.

Item type: Conference paper
Keywords: Wwb archive, digital heritage, digital preservation
Subjects: H. Information sources, supports, channels. > HQ. Web pages.
J. Technical services in libraries, archives, museum. > JH. Digital preservation.
H. Information sources, supports, channels. > HS. Repositories.
Depositing user: Sonia Marcos Macia
Date deposited: 21 Jun 2009
Last modified: 02 Oct 2014 12:14


Cócera, Daniel; Llueca, C. (2008). PADICAT: realitat i reptes de 3 anys d'arxiu web de Catalunya. In Jornades Catalanes d'Informació i Documentació, pp. 163-178.

Dalbello, Marija (2008) Circulating culture for the knowledge continuum: living history, digital history and the history web . In Pacevicius, Arvydas and Manzuch, Zinaida, Eds. Proceedings Memory in Digits: Communication of Memory in Archives, Libraries and Museums: The Interaction of Science, Policy and Practice, pp. 34-47, Vilnius University. Retrieved april 2009 from

Day, M. (2003). Collecting and preserving the World Wide Web: a feasibility study undertaken for the JISC and Wellcome Trust. . Retrieved april 2009 from

España. Ministerio de Cultura. Panorámica de la Edición en España. Retrieved april 2009 from

España. Ministerio de Industria, Turismo y Comercio, Retrieved april 2009

Llueca, C. (2005). Webs siempre accesibles: las bibliotecas nacionales y los depósitos digitales nacionales. In BiD: textos universitaris de biblioteconomia i documentació (15). Retrieved april 2009 from

Llueca, C. (2008). El archivo de Internet: la experiencia del proyecto PADICAT (Patrimonio Digital de Cataluña. In IV Encuentros de Centros de Documentación de Arte Contemporáneo, Vitoria-Gasteiz (Spain)

National Library of Australia. PADI, Preserving Access to Digital Information. Retrieved april 2009 from

Paynter, G., Joe, S., Lala, V. & Lee, G. (2008). A Year of Selective Web Archiving with the Web Curator at the National Library of New Zealand In D-Lib Magazine, 14 (5/6) Retrieved april 2009 from

Plan Vasco de la Cultura. (2004) Vitoria-Gasteiz : Central de Publicaciones del Gobierno Vasco,

Pulgar Vernalte, F. & Marcos Maciá, S. (2008). Ondarenet: el archivo del patrimonio digital vasco. In X Jornadas de Gestión de la Información, Madrid (Spain), 20-21 November 2008

Ras, M & Van Bussel, S. (2007) Web archiving user survey. Retrieved april 2009 from

Serra, E. (2006). Archivando la Web catalana: iniciativas cooperativas de preservación digital en Catalunya". In La Recuperación de la memoria, muchas más oportunidades que realidades: el trabajo cooperativo de archivos, bibliotecas y museos. Universidad del País Vasco 2006. Retrieved april 2009 from

UNESCO. (2003). Directrices para la preservación del patrimonio digital. Retrieved april 2009 from


Downloads per month over past year

Actions (login required)

View Item View Item