Siles Canales, Francisco , Calderón Ramírez, Saúl and Villalta Fallas, Marco ¡200 Petabytes a 100 Megadólares!: Surá – Clúster para el almacenamiento y procesamiento de datos científicos del PRIS-LAB., 2013 . In III Conferencia Internacional de "Acceso abierto, preservación digital y datos científicos" III Conferecia Bibliotecas y Repositorios Digitales de América Latina (BIREDIAL '13) VIII Simposio Internacional de Bibliotecas Digitales (SIBD '13), Ciudad de la Investigación, Universidad de Costa Rica, 15-17 octubre 2013. (Unpublished) [Conference poster]
Preview |
Image
Póster 72-268-1-PB.pdf Download (4MB) | Preview |
English abstract
-
Spanish abstract
El desarrollo de sistemas computacionales más poderosos en la últimas décadas ha facultado el dar soporte a nuevas aplicaciones, en particular aquellas relacionadas con el análisis de actividades humanas [1-4]. En el caso del deporte, el fútbol ha sido un foco de atención para muchos investigadores interdisciplinarios. Dicho interés se sustenta en el hecho de ser el fútbol, uno de los deportes más ricos, complejos y diseminados practicado actualmente. Muchos grupos relacionados al fútbol (entrenadores, periodistas, estadístas, fisioterapeutas), desean obtener información acerca del juego desde diversas perspectivas, de una forma eficiente y objetiva. Para solventar estas necesidades se requiere investigar y desarrollar sistemas computacionales automatizados avanzados con calidades de eficiencia y objetividad [5-20]. En muchos de los sistemas actuales se utiliza videos de televisión, por ser un mecanismo acequible y barato. Los videos deben ser almacenados para su posterior procesamiento, lo cual es un problema por el volumen de datos. A continuación se describe la línea de investigación del laboratorio relacionada con el análisis deportivo, posteriormente se describirá el problema del almacenamiento de datos y la solución propuesta. El propósito de la línea de investigación ACE del PRIS-LAB consiste en desarrollar sistemas de modelado computacional para el análisis deportivo automatizado. Actualmente, el deporte principal estudiado es el fútbol. El sistema está dividido en dos partes, por un lado, módulos de percepción requeridos para generar las trayectorias seguidas por los objetivos (jugadores, árbitros, y la bola) durante el juego; y por otro lado, los módulos cognitivos para proveer un modelado abstracto de las acciones, eventos y episodios a partir de las trayectorias generadas, con un valor semántico agregado. El proyecto de investigación Rastreo automatizado de jugadores de fútbol a partir de señales de televisión (322-B2-269), inscrito en la Vicerrectoría de Investigación de la UCR, se concentra en investigar la etapa de percepción. La validación de los algoritmos desarrollados se realiza utilizando datos de mundiales de fútbol de la FIFA. Para almacenar estos datos es imprescindible contar con una alta capacidad de memoria, pues la cantidad de información masiva que se genera alrededor del fútbol así lo requiere. Como un ejemplo concreto de las necesidades de almacenamiento, se realiza un cálculo para almacenar 4 mundiales de fútbol. Utilizando alta definición, cada imagen tiene resolución de 1920x1080, para la cual se almacena tres componentes de color R, G y B por píxel. Por otro lado, utilizando 30 cuadros por segundo y suponiendo una duración por juego de 90 minutos, se requiere por juego de aproximadamente 1000000MB (1TB). Finalmente, cada video de entrada producirá al menos un video de salida procesado, y se desea un respaldo de al menos una copia. Por lo cual, el gran total de capacidad de memoria requerida es de 1000TB (1PB, un Petabyte). Este análisis, es muy conservador, pues ignora la necesidad de almacenar otros juegos: Mundial Femenino, Mundial Juvenil, Champions League, Bundesliga. Por otro lado, actualmente están aprobados por la Unión de Telecomunicaciones Internacional, resoluciones de 3840x2160 y 7680x4320. En resumen, se requerirá en el futuro cercano 200PB aproximadamente, lo cual representaría una inversión imposible de ¡100 millones de dólares! o (100 Megadólares), la cual además es imposible de construir con la tecnología actual de discos duros. Claramente es imprescindible utilizar mecanismos de compresión para los videos, con capacidad de acceder a cada cuadro utilizando un modelo de acceso aleatorio, es decir cualquier cuadro puede ser accedido en cualquier instante. Para implementar este acceso a una velocidad mínima para soportar la aplicación científica se debe contar con capacidad de procesamiento para descomprimir el video y proveer los cuadros al ancho de banda necesario, además el sistema debe procesar los algoritmos de rastreo para producir en tiempo real los resultados esperados. Como solución al problema se implementó el sistema Surá que es un cúster Beowulf de Linux, cuyos componentes fueron donados a la Escuela de Ingeniería Eléctrica por Componentes Intel de Costa Rica, hace algunos años. El clúster consiste en un nodo maestro y tres esclavos. El nodo maestro es un servidor DellPowerEdgeT710 con 2 procesadores Quad-CoreE5560, con 2 discos duros SATA-500GB-7200rpm. Cada nodo esclavo consiste en una DellVostro430 con procesador Corei5-750, con 1 disco duro SATA- 250GB-7200rpm y una NVIDIA-GeForce-G310. Como ejemplo de una computación científica sobre los videos de fútbol se calculó la transformación entre espacios de color de RGB a HSV para distintas resoluciones de imágenes en dos plataformas distintas y los resultados se muestran en los cuadros 1 y 2. El cuadro 1 muestra los resultados en un CPU Corei7-2600 utilizando una GPU-Geforce-GTX760ACX con 1152-CUDA-Cores. En el cuadro 2 se muesta los resultados de Surá, donde se obtuvo una ventaja de tiempo del orden de 10.
Item type: | Conference poster |
---|---|
Keywords: | datos Científicos, Preservación de video, Televisión, Rastreo en fútbol, Clúster Beowulf, MPI, CUDA |
Subjects: | B. Information use and sociology of information > BH. Information needs and information requirements analysis. |
Depositing user: | Andrey Barrantes Vargas |
Date deposited: | 17 Nov 2013 06:51 |
Last modified: | 02 Oct 2014 12:28 |
URI: | http://hdl.handle.net/10760/20566 |
References
Downloads
Downloads per month over past year
Actions (login required)
View Item |