La Representación de Recursos en los Repositorios Institucionales. El Caso de SEDICI, Repositorio Institucional de la Universidad Nacional de La Plata

Texier, Jose and De Giusti, Marisa R. and Oviedo, Nestor and Lira, Ariel and Villarreal, Gonzalo La Representación de Recursos en los Repositorios Institucionales. El Caso de SEDICI, Repositorio Institucional de la Universidad Nacional de La Plata., 2013 . In III Conferencia Internacional de "Acceso abierto, preservación digital y datos científicos" III Conferecia Bibliotecas y Repositorios Digitales de América Latina (BIREDIAL '13) VIII Simposio Internacional de Bibliotecas Digitales (SIBD '13), Ciudad de la Investigación, Universidad de Costa Rica, 15-17 octubre 2013. (Unpublished) [Conference paper]

[img]
Preview
Text
Ponencia 14-79-2-DR.pdf

Download (296kB) | Preview
[img]
Preview
Slideshow
Presentación 14-231-1-PB.pdf

Download (2MB) | Preview

English abstract

-

Spanish abstract

En el 2003, nace el Servicio de Difusión de la Creación Intelectual (SEDICI) como el repositorio institucional de la Universidad Nacional de La Plata (UNLP), con el objetivo prioritario de socializar el conocimiento generado en las diferentes áreas académicas de la Universidad, para devolver a la comunidad los esfuerzos destinados a la Universidad Pública. SEDICI, como un portal de acceso libre, estuvo soportado por un desarrollo de software propio en PHP, MySQL y Java, llamado Celsius DL, que estaba adaptado a estándares internacionales como XML, OAI-PMH, SOAP, y permitía el depósito y búsqueda de recursos, los cuales son objetos físicos o digitales que se describen a partir de la enumeración de un conjunto de datos específicos que lo distinguen entre otros objetos. Celsius DL fue creciendo en funcionalidades por lo que el diseño, mantenimiento e implementación convirtieron a la plataforma de software de SEDICI en una herramienta compleja, principalmente por dos razones: por una parte porque se requería de mayor tiempo y recurso humano y, por otra, porque se hacía necesaria una actualización de tecnologías de manera que no estuvieran en desventaja frente a nuevos desarrollos e investigaciones.Por los motivos arriba mencionados, para finales del 2011, se estudió la posibilidad de migrar a una plataforma que estuviera a la par de las nuevas tecnologías aplicadas al dominio y que fuera más amena para el usuario y para la gestión de recursos por parte del personal de SEDICI, así como a los fines de la preservación del material. El análisis tenía el objetivo de comparar diferentes plataformas de software: DSpace, EPrints, FEDORA y Greenstone. La conclusión del estudio determinó que DSpace era la herramienta de software que mejor se adaptaba a las necesidades de SEDICI. El proceso de migración de Celsius DL a DSpace finalizó en el 2012. Esto permitió contar con nuevas funcionalidades como: búsquedas y faceting, proveedor de datos y de servicios de acuerdo con el protocolo OAI-PMH, autenticación de usuarios, facilidad en la indexación por parte de los buscadores Web, etc. En otras palabras, se logró una flexibilidad en los cambios estratégicos por parte de la gerencia del repositorio, modificaciones en la imagen institucional sin afectar la lógica del repositorio y ampliar la gestión de las tipologías de los recursos aceptados. DSpace, al igual que otras plataformas, presenta limitaciones en diferentes ámbitos tales como: procesos de depósitos, manejo de estadísticas y de las comunidades-colecciones-items, vocabularios controlados centrados en los autores, representación de los recursos, etc. De estas limitaciones, la representación de los recursos - que consiste en el proceso de registrar en forma persistente un conjunto de datos como síntesis y reemplazo del objeto "real" para poder identificarlo, recuperarlo y distribuirlo - es uno de los principales problemas presentados en la transición de Celsius DL a DSpace, ya que se migraron muchos recursos en forma separada e incluso se realizaron adaptaciones por incompatibilidad de ambos sistemas porque la representación de distintos recursos era muy variada. Este proceso es llevado a cabo de diversas maneras en plataformas para repositorios. Por tanto, este trabajo se centrará en describir el problema de la representación de recursos dentro de un repositorio institucional y en exponer algunas de las posibles soluciones.El presente trabajo se limitará a la representación de recursos de SEDICI y a la tipología de recursos más importante de SEDICI: artículos de investigación, tesinas de grado y tesis de postgrado, libros, autores, instituciones, revistas y sus números, eventos y sus instancias. Estos recursos cuentan con diferentes características que representan los metadatos de cada uno de ellos. Para la representación de metadatos se han desarrollado distintos modelos, esquemas, formatos o estándares, que si bien comparten una sintaxis y estructura de la información en XML, difieren atendiendo a los propósitos de la información que describen. Entre estos esquemas de metadatos más utilizados en el mundo de la ciencia de la información se encuentran: MARC, DC, MODS, PREMIS, METS, MADS, LOM. Estos esquemas de metadatos junto con los recursos se convierten en el elemento central para una representación de recursos básica dentro de los RI. A continuación se presentan algunas características a tomar en cuenta:- Los recursos deben estar catalogados en más de un esquema de metadatos a fin de evitar pérdida de información cuando se almacenen y se realicen mapeos entre los esquemas de metadatos deseados.- Debido a la gran diversidad en las estructuras (planas y jerárquicas) y restricciones de cada esquema de metadatos, es necesario plantear una solución de representación clara, flexible, factible, escalable, interoperable, mantenible y que no represente un desafío de configuración para los administradores, así como tampoco sea complicada su utilización por parte de los usuarios.- Muchos campos presentes en los esquemas de metadatos necesitan ser estandarizados (por ejemplo: aplicación de vocabularios controlados o tesauros) para garantizar una identificación y recuperación correcta de acuerdo con las características de los recursos usados, a fin de evitar la redundancia y garantizar la integridad de la información.- En estos sistemas, frecuentemente, se encuentran elementos que poseen información descriptiva propia, conocidos como entidades abstractas que son representadas de forma separada. Por ello, es necesario permitir su reutilización en los diferentes procesos del repositorio y garantizar su representación.- Las entidades abstractas pueden tener distintas representaciones según el esquema de metadatos en el que se represente el recurso y la semántica deseada en dicha representación.- Todos los metadatos de los recursos de un repositorio institucional debe almacenarse de forma persistente (perdure en el tiempo), por ello, este almacenamiento debe ser configurable a cualquier tipo de paradigma de base de datos e independiente del modelo de representación de los recursos definido.- Para una representación de los recursos básica, se deben tomar en cuenta los siguientes módulos: almacenamiento, catalogación, indexación, infraestructura de la plataforma de software y preservación. El tema de esta investigación (la representación de recursos) es un problema recurrente que ha sido estudiado por algunos autores como Malizia (2010), Paganelli (2005), Gonçalves (2004), Fox (2004), Candela (2007), entre otros. No obstante sus trabajos abordan el tema mediante sistemas diseñados en forma general en los que no se toma en cuenta el recurso como el eje central, de este modo se considera que este trabajo puede aportar al avance en una investigación muy sensible en el área de repositorios.

Item type: Conference paper
Keywords: representación de recursos, repositorios institucionales, SEDICI, DSpace.
Subjects: H. Information sources, supports, channels. > HS. Repositories.
Depositing user: Andrey Barrantes Vargas
Date deposited: 16 Nov 2013 05:07
Last modified: 02 Oct 2014 12:28
URI: http://hdl.handle.net/10760/20514

References

[1] SEDICI, “SeDiCI - Repositorio de la Universidad Nacional de La Plata,” 2013. [Online]. Available: http://sedici.unlp.edu.ar/. [Accessed: 14-Mar-2012].

[2] M. De Giusti, N. Oviedo, A. Lira, A. Sobrado, J. Martínez, and A. Pinto, “SeDiCI – Desafíos y experiencias en la vida de un repositorio digital,” RENATA, vol. 1, no. 2, pp. 16–33, Aug. 2011.

[3] J. Tramullas Saz and P. Garrido Picazo, “Software libre para repositorios institucionales: propuestas para un modelo de evaluación de prestaciones,” El Prof. Inf., vol. 15, no. 3, pp. 171–181, 2006.

[4] D. P. Madalli, S. Barve, and S. Amin, “Digital Preservation in Open-Source Digital Library Software,” J. Acad. Librariansh., vol. 38, no. 3, pp. 161–164, May 2012.

[5] S. K. Singh, M. Witt, and S. Dorothea, “A Comparative Analysis of Institutional Repository Software,” presented at the Fifth International Conference on Open Repositories, Madrid, 2010.

[6] G. Pyrounakis and M. Nikolaidou, “Comparing Open Source Digital Library Software,” Handb. Res. Digit. Libr. Des. Dev. Impact, pp. 51–60, Feb. 2009.

[7] E. Tzoc, “A Mobile Interface for DSpace,” -Lib Mag., vol. 19, no. 3/4, Mar. 2013.

[8] OpenDOAR, “OpenDOAR - Home Page - Directory of Open Access Repositories,” 2013. [Online]. Available: http://www.opendoar.org/. [Accessed: 21-Mar-2013].

[9] ROAR, “Registry of Open Access Repositories (ROAR),” 2013. [Online]. Available: http://roar.eprints.org/. [Accessed: 21-Mar-2013].

[10] M. Kökörvcený and A. Bodnárová, “Comparison of digital libraries systems,” in Proceedings of the 9th WSEAS international conference on Data networks, communications, computers, Stevens Point, Wisconsin, USA, 2010, pp. 97–100.

[11] A. Malizia, P. Bottoni, and S. Levialdi, “Generating Collaborative Systems for Digital Libraries: a Model-Driven Approach,” Inf. Technol. Libr., vol. 29, Dec. 2010.

[12] F. Paganelli and M. C. Pettenati, “A Model-driven Method for the Design and Deployment of Web-based Document Management Systems,” J. Digit. Inf., vol. 6, no. 3, Jan. 2006.

[13] M. A. Gonçalves, E. A. Fox, L. T. Watson, and N. A. Kipp, “Streams, structures, spaces, scenarios, societies (5s): A formal model for digital libraries,” Acm Trans Inf Syst, vol. 22, no. 2, pp. 270–312, Apr. 2004.

[14] Leonardo Candela, Castelli, Y. Ioannidis, S. Ross, C. Thanos, P. Pagano, G. Koutrika, H.-J. Schek, and H. Schuldt, “Setting the Foundations of Digital Libraries,” -Lib, vol. 13, no. 3/4, Mar. 2007.

[15] R. Heery, “Review of metadata formats,” Program Electron. Libr. Inf. Syst., vol. 30, no. 4, pp. 345–373, Dec. 1996.

[16] E. Méndez, “Tratamiento de los objetos de información en los archivos : retos y estándares para la descripción basada en metadatos,” 2003. [Online]. Available: http://eprints.rclis.org/handle/10760/12691#.UAAZFuEzfgM. [Accessed: 13-Jul-2012].

[17] DCMI, “Dublin Core Metadata Element Set, Version 1.1,” 2012. [Online]. Available: http://www.dublincore.org/documents/dces/. [Accessed: 13-Jul-2012].

[18] MARC, “MARC STANDARDS (Network Development and MARC Standards Office, Library of Congress).” [Online]. Available: http://www.loc.gov/marc/. [Accessed: 11-Jun-2013].

[19] MODS, “Metadata Object Description Schema: MODS (Library of Congress),” 2012. [Online]. Available: http://www.loc.gov/standards/mods/. [Accessed: 13-Jul-2012].

[20] T. Ferreras Fernández, “Preservación digital en repositorios institucionales: GREDOS,” 2010. [Online]. Available: http://gredos.usal.es/jspui/handle/10366/83130. [Accessed: 13-Jul-2012].

[21] MADS, “Metadata Authority Description Schema (MADS) - (Library of Congress).” [Online]. Available: http://www.loc.gov/standards/mads/. [Accessed: 11-Jun-2013].

[22] METS, “Metadata Encoding and Transmission Standard (METS) Official Web Site,” 2012. [Online]. Available: http://www.loc.gov/standards/mets/. [Accessed: 13-Jul-2012].

[23] PREMIS, “PREMIS: Preservation Metadata Maintenance Activity (Library of Congress),” 2012. [Online]. Available: http://www.loc.gov/standards/premis/. [Accessed: 13-Jul-2012].

[24] PREMIS, PREMIS Data Dictionary for Preservation Metadata -- version 2.0. 2008.

[25] C. A. Lynch, “Institutional Repositories: Essential Infrastructure for Scholarship in the Digital Age,” ARL:, Feb-2003. [Online]. Available: http://www.arl.org/resources/pubs/br/br226/br226ir.shtml. [Accessed: 28-Jan-2013].

[26] H. Van de Sompel, S. Payette, J. Erickson, C. Lagoze, and S. Warner, “Rethinking Scholarly Communication,” -Lib Mag., vol. 10, no. 9, Sep. 2004.

[27] J. Texier, M. R. De Giusti, N. Oviedo, G. L. Villarreal, and A. J. Lira, “Los beneficios del desarrollo dirigido por modelos en los repositorios institucionales,” presented at the BIREDIAL - Conferencia Internacional Acceso Abierto, Comunicación Científica y Preservación Digital, 2012.

[28] J. Texier, M. R. De Giusti, N. Oviedo, G. L. Villarreal, and A. J. Lira, “El uso de repositorios y su importancia para la educación en Ingeniería,” presented at the World Engineering Education Forum (WEEF 2012) “Educación en Ingeniería para el Desarrollo Sostenible y la inclusión social,” 2012.

[29] Webometrics, “Ranking Web of Repositories,” 2013. [Online]. Available: http://repositories.webometrics.info/. [Accessed: 08-Mar-2013].

[30] L. M. Chan and M. L. Zeng, “Metadata Interoperability and Standardization - A Study of Methodology, Part I,” -Lib Mag., vol. 12, no. 6, p. 3–, 2006.

[31] E. Méndez, “La descripción de documentos electrónicos a través de metadatos : una visión para la Archivística desde la nueva e- Administración,” Revista d’Arxius, 2003. [Online]. Available: http://eprints.rclis.org/12684/. [Accessed: 05-Jun-2013].

[32] E. Duval, W. Hodgins, S. Sutton, and S. L. Weibel, “Metadata Principles and Practicalities,” -Lib Mag., vol. 8, no. 4, Apr. 2002.


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item