Texier, Jose , De Giusti, Marisa R., Oviedo, Nestor , Lira, Ariel and Villarreal, Gonzalo La Representación de Recursos en los Repositorios Institucionales. El Caso de SEDICI, Repositorio Institucional de la Universidad Nacional de La Plata., 2013 . In III Conferencia Internacional de "Acceso abierto, preservación digital y datos científicos" III Conferecia Bibliotecas y Repositorios Digitales de América Latina (BIREDIAL '13) VIII Simposio Internacional de Bibliotecas Digitales (SIBD '13), Ciudad de la Investigación, Universidad de Costa Rica, 15-17 octubre 2013. (Unpublished) [Conference paper]
Preview |
Text
Ponencia 14-79-2-DR.pdf Download (296kB) | Preview |
Preview |
Slideshow
Presentación 14-231-1-PB.pdf Download (2MB) | Preview |
English abstract
-
Spanish abstract
En el 2003, nace el Servicio de Difusión de la Creación Intelectual (SEDICI) como el repositorio institucional de la Universidad Nacional de La Plata (UNLP), con el objetivo prioritario de socializar el conocimiento generado en las diferentes áreas académicas de la Universidad, para devolver a la comunidad los esfuerzos destinados a la Universidad Pública. SEDICI, como un portal de acceso libre, estuvo soportado por un desarrollo de software propio en PHP, MySQL y Java, llamado Celsius DL, que estaba adaptado a estándares internacionales como XML, OAI-PMH, SOAP, y permitía el depósito y búsqueda de recursos, los cuales son objetos físicos o digitales que se describen a partir de la enumeración de un conjunto de datos específicos que lo distinguen entre otros objetos. Celsius DL fue creciendo en funcionalidades por lo que el diseño, mantenimiento e implementación convirtieron a la plataforma de software de SEDICI en una herramienta compleja, principalmente por dos razones: por una parte porque se requería de mayor tiempo y recurso humano y, por otra, porque se hacía necesaria una actualización de tecnologías de manera que no estuvieran en desventaja frente a nuevos desarrollos e investigaciones.Por los motivos arriba mencionados, para finales del 2011, se estudió la posibilidad de migrar a una plataforma que estuviera a la par de las nuevas tecnologías aplicadas al dominio y que fuera más amena para el usuario y para la gestión de recursos por parte del personal de SEDICI, así como a los fines de la preservación del material. El análisis tenía el objetivo de comparar diferentes plataformas de software: DSpace, EPrints, FEDORA y Greenstone. La conclusión del estudio determinó que DSpace era la herramienta de software que mejor se adaptaba a las necesidades de SEDICI. El proceso de migración de Celsius DL a DSpace finalizó en el 2012. Esto permitió contar con nuevas funcionalidades como: búsquedas y faceting, proveedor de datos y de servicios de acuerdo con el protocolo OAI-PMH, autenticación de usuarios, facilidad en la indexación por parte de los buscadores Web, etc. En otras palabras, se logró una flexibilidad en los cambios estratégicos por parte de la gerencia del repositorio, modificaciones en la imagen institucional sin afectar la lógica del repositorio y ampliar la gestión de las tipologías de los recursos aceptados. DSpace, al igual que otras plataformas, presenta limitaciones en diferentes ámbitos tales como: procesos de depósitos, manejo de estadísticas y de las comunidades-colecciones-items, vocabularios controlados centrados en los autores, representación de los recursos, etc. De estas limitaciones, la representación de los recursos - que consiste en el proceso de registrar en forma persistente un conjunto de datos como síntesis y reemplazo del objeto "real" para poder identificarlo, recuperarlo y distribuirlo - es uno de los principales problemas presentados en la transición de Celsius DL a DSpace, ya que se migraron muchos recursos en forma separada e incluso se realizaron adaptaciones por incompatibilidad de ambos sistemas porque la representación de distintos recursos era muy variada. Este proceso es llevado a cabo de diversas maneras en plataformas para repositorios. Por tanto, este trabajo se centrará en describir el problema de la representación de recursos dentro de un repositorio institucional y en exponer algunas de las posibles soluciones.El presente trabajo se limitará a la representación de recursos de SEDICI y a la tipología de recursos más importante de SEDICI: artículos de investigación, tesinas de grado y tesis de postgrado, libros, autores, instituciones, revistas y sus números, eventos y sus instancias. Estos recursos cuentan con diferentes características que representan los metadatos de cada uno de ellos. Para la representación de metadatos se han desarrollado distintos modelos, esquemas, formatos o estándares, que si bien comparten una sintaxis y estructura de la información en XML, difieren atendiendo a los propósitos de la información que describen. Entre estos esquemas de metadatos más utilizados en el mundo de la ciencia de la información se encuentran: MARC, DC, MODS, PREMIS, METS, MADS, LOM. Estos esquemas de metadatos junto con los recursos se convierten en el elemento central para una representación de recursos básica dentro de los RI. A continuación se presentan algunas características a tomar en cuenta:- Los recursos deben estar catalogados en más de un esquema de metadatos a fin de evitar pérdida de información cuando se almacenen y se realicen mapeos entre los esquemas de metadatos deseados.- Debido a la gran diversidad en las estructuras (planas y jerárquicas) y restricciones de cada esquema de metadatos, es necesario plantear una solución de representación clara, flexible, factible, escalable, interoperable, mantenible y que no represente un desafío de configuración para los administradores, así como tampoco sea complicada su utilización por parte de los usuarios.- Muchos campos presentes en los esquemas de metadatos necesitan ser estandarizados (por ejemplo: aplicación de vocabularios controlados o tesauros) para garantizar una identificación y recuperación correcta de acuerdo con las características de los recursos usados, a fin de evitar la redundancia y garantizar la integridad de la información.- En estos sistemas, frecuentemente, se encuentran elementos que poseen información descriptiva propia, conocidos como entidades abstractas que son representadas de forma separada. Por ello, es necesario permitir su reutilización en los diferentes procesos del repositorio y garantizar su representación.- Las entidades abstractas pueden tener distintas representaciones según el esquema de metadatos en el que se represente el recurso y la semántica deseada en dicha representación.- Todos los metadatos de los recursos de un repositorio institucional debe almacenarse de forma persistente (perdure en el tiempo), por ello, este almacenamiento debe ser configurable a cualquier tipo de paradigma de base de datos e independiente del modelo de representación de los recursos definido.- Para una representación de los recursos básica, se deben tomar en cuenta los siguientes módulos: almacenamiento, catalogación, indexación, infraestructura de la plataforma de software y preservación. El tema de esta investigación (la representación de recursos) es un problema recurrente que ha sido estudiado por algunos autores como Malizia (2010), Paganelli (2005), Gonçalves (2004), Fox (2004), Candela (2007), entre otros. No obstante sus trabajos abordan el tema mediante sistemas diseñados en forma general en los que no se toma en cuenta el recurso como el eje central, de este modo se considera que este trabajo puede aportar al avance en una investigación muy sensible en el área de repositorios.
Item type: | Conference paper |
---|---|
Keywords: | representación de recursos, repositorios institucionales, SEDICI, DSpace. |
Subjects: | H. Information sources, supports, channels. > HS. Repositories. |
Depositing user: | Andrey Barrantes Vargas |
Date deposited: | 16 Nov 2013 05:07 |
Last modified: | 02 Oct 2014 12:28 |
URI: | http://hdl.handle.net/10760/20514 |
References
Downloads
Downloads per month over past year
Actions (login required)
View Item |