¡200 Petabytes a 100 Megadólares!: Surá – Clúster para el almacenamiento y procesamiento de datos científicos del PRIS-LAB.

Siles Canales, Francisco , Calderón Ramírez, Saúl and Villalta Fallas, Marco ¡200 Petabytes a 100 Megadólares!: Surá – Clúster para el almacenamiento y procesamiento de datos científicos del PRIS-LAB., 2013 . In III Conferencia Internacional de "Acceso abierto, preservación digital y datos científicos" III Conferecia Bibliotecas y Repositorios Digitales de América Latina (BIREDIAL '13) VIII Simposio Internacional de Bibliotecas Digitales (SIBD '13), Ciudad de la Investigación, Universidad de Costa Rica, 15-17 octubre 2013. (Unpublished) [Conference poster]

[thumbnail of Póster 72-268-1-PB.pdf]
Preview
Image
Póster 72-268-1-PB.pdf

Download (4MB) | Preview

English abstract

-

Spanish abstract

El desarrollo de sistemas computacionales más poderosos en la últimas décadas ha facultado el dar soporte a nuevas aplicaciones, en particular aquellas relacionadas con el análisis de actividades humanas [1-4]. En el caso del deporte, el fútbol ha sido un foco de atención para muchos investigadores interdisciplinarios. Dicho interés se sustenta en el hecho de ser el fútbol, uno de los deportes más ricos, complejos y diseminados practicado actualmente. Muchos grupos relacionados al fútbol (entrenadores, periodistas, estadístas, fisioterapeutas), desean obtener información acerca del juego desde diversas perspectivas, de una forma eficiente y objetiva. Para solventar estas necesidades se requiere investigar y desarrollar sistemas computacionales automatizados avanzados con calidades de eficiencia y objetividad [5-20]. En muchos de los sistemas actuales se utiliza videos de televisión, por ser un mecanismo acequible y barato. Los videos deben ser almacenados para su posterior procesamiento, lo cual es un problema por el volumen de datos. A continuación se describe la línea de investigación del laboratorio relacionada con el análisis deportivo, posteriormente se describirá el problema del almacenamiento de datos y la solución propuesta. El propósito de la línea de investigación ACE del PRIS-LAB consiste en desarrollar sistemas de modelado computacional para el análisis deportivo automatizado. Actualmente, el deporte principal estudiado es el fútbol. El sistema está dividido en dos partes, por un lado, módulos de percepción requeridos para generar las trayectorias seguidas por los objetivos (jugadores, árbitros, y la bola) durante el juego; y por otro lado, los módulos cognitivos para proveer un modelado abstracto de las acciones, eventos y episodios a partir de las trayectorias generadas, con un valor semántico agregado. El proyecto de investigación Rastreo automatizado de jugadores de fútbol a partir de señales de televisión (322-B2-269), inscrito en la Vicerrectoría de Investigación de la UCR, se concentra en investigar la etapa de percepción. La validación de los algoritmos desarrollados se realiza utilizando datos de mundiales de fútbol de la FIFA. Para almacenar estos datos es imprescindible contar con una alta capacidad de memoria, pues la cantidad de información masiva que se genera alrededor del fútbol así lo requiere. Como un ejemplo concreto de las necesidades de almacenamiento, se realiza un cálculo para almacenar 4 mundiales de fútbol. Utilizando alta definición, cada imagen tiene resolución de 1920x1080, para la cual se almacena tres componentes de color R, G y B por píxel. Por otro lado, utilizando 30 cuadros por segundo y suponiendo una duración por juego de 90 minutos, se requiere por juego de aproximadamente 1000000MB (1TB). Finalmente, cada video de entrada producirá al menos un video de salida procesado, y se desea un respaldo de al menos una copia. Por lo cual, el gran total de capacidad de memoria requerida es de 1000TB (1PB, un Petabyte). Este análisis, es muy conservador, pues ignora la necesidad de almacenar otros juegos: Mundial Femenino, Mundial Juvenil, Champions League, Bundesliga. Por otro lado, actualmente están aprobados por la Unión de Telecomunicaciones Internacional, resoluciones de 3840x2160 y 7680x4320. En resumen, se requerirá en el futuro cercano 200PB aproximadamente, lo cual representaría una inversión imposible de ¡100 millones de dólares! o (100 Megadólares), la cual además es imposible de construir con la tecnología actual de discos duros. Claramente es imprescindible utilizar mecanismos de compresión para los videos, con capacidad de acceder a cada cuadro utilizando un modelo de acceso aleatorio, es decir cualquier cuadro puede ser accedido en cualquier instante. Para implementar este acceso a una velocidad mínima para soportar la aplicación científica se debe contar con capacidad de procesamiento para descomprimir el video y proveer los cuadros al ancho de banda necesario, además el sistema debe procesar los algoritmos de rastreo para producir en tiempo real los resultados esperados. Como solución al problema se implementó el sistema Surá que es un cúster Beowulf de Linux, cuyos componentes fueron donados a la Escuela de Ingeniería Eléctrica por Componentes Intel de Costa Rica, hace algunos años. El clúster consiste en un nodo maestro y tres esclavos. El nodo maestro es un servidor DellPowerEdgeT710 con 2 procesadores Quad-CoreE5560, con 2 discos duros SATA-500GB-7200rpm. Cada nodo esclavo consiste en una DellVostro430 con procesador Corei5-750, con 1 disco duro SATA- 250GB-7200rpm y una NVIDIA-GeForce-G310. Como ejemplo de una computación científica sobre los videos de fútbol se calculó la transformación entre espacios de color de RGB a HSV para distintas resoluciones de imágenes en dos plataformas distintas y los resultados se muestran en los cuadros 1 y 2. El cuadro 1 muestra los resultados en un CPU Corei7-2600 utilizando una GPU-Geforce-GTX760ACX con 1152-CUDA-Cores. En el cuadro 2 se muesta los resultados de Surá, donde se obtuvo una ventaja de tiempo del orden de 10.

Item type: Conference poster
Keywords: datos Científicos, Preservación de video, Televisión, Rastreo en fútbol, Clúster Beowulf, MPI, CUDA
Subjects: B. Information use and sociology of information > BH. Information needs and information requirements analysis.
Depositing user: Andrey Barrantes Vargas
Date deposited: 17 Nov 2013 06:51
Last modified: 02 Oct 2014 12:28
URI: http://hdl.handle.net/10760/20566

References

[1] J. K. Aggarwal and M. S. Ryoo1, “Human activity analysis: A review”, in Journal ACM Computing Surveys (CSUR), vol. 43, ACM New York, NY, USA, 2011.

[2] P. Turaga, R. Chellappa, V. S. Subrahmanian, and O. Udrea, “Machine recognition of human activities: A survey,” in IEEE Transactions on Circuits and Systems for Video Technology, 2008.

[3] T. B. Moeslund, A. Hilton, and V. Krüger, “A survey of advances in vision-based human motion capture and analysis,” Computer Vision and Image Understanding, vol. 104, no. 2-3, pp. 90 – 126, 2006, special Issue on Modeling People: Vision-based understanding of a person’s shape, appearance, movement and behaviour.

[4] J. K. Aggarwal and Q. Cai, “Human motion analysis: A review,” in Nonrigid and Articulated Motion Workshop. IEEE, 1997, pp. 90–102.

[5] T. D’Orazio and M. Leo, “A review of vision-based systems for soccer video analysis,” in Pattern Recognition, vol. 43. New York, NY, USA: Elsevier Science Inc., 2010, pp. 2911–2926.

[6] J. R. Wang and N. Parameswaran, “Survey of sports video analysis: Research issues and applications,” 2004.

[7] D. Setterwall, “Computerised video analysis of football - technical and commercial possibilities for football coaching,” Master’s thesis, KTH Stockholm, 2003.

[8] C. J. Needham, “Tracking and modelling of team game interactions,” Ph.D. dissertation, University of Leeds, October 2003.

[9] D. G. Liebermann, L. Katz, M. D. Hughes, R. M. Bartlett, J. Mc-Clements, and I. M. Franks, “Advances in the application of information technology to sport performance,” Journal of Sports Sciences, vol. 20, no. 10, pp. 755–769, 2002.

[10] ProZone Sports Ltd., “MatchInsight,” http://www.prozonesports.com/index.html.

[11] Sport Universal, “Amisco,” http://www.sport-universal.com/.

[12] Elite Sports Analysis, “Elite Sports Analysis - Sports statistics and Performance analysis,” http://www.elitesportsanalysis.com/index.htm.

[13] Sportstec, “Sports Video Analysis Software Video Performance Analysis,” http://www.sportstec.com/.

[14] Cairos AG, http://www.paninidigital.com/.

[15] Cairos AG, “Cairos AG,” http://www.cairos.com.

[16] Opta Sportsdata Ltd., “Opta sportsdata,” http://www.optasports.com/.

[17] Ascensio System Ltd., “Ascensio system,” http://www.footballsoftpro.com/.

[18] TRACAB, “Tracab image tracking system,” http://www.tracab.com/.

[19] Orad, “Trackvision,” http://www.orad.tv/products/trackvision.

[20] Siles, F. “Temporal Segmentation of Association Football from TV Broadcasting”. INES 2013 – IEEE 17th International Conference on Intelligent Engineering Systems, San José, Costa Rica.


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item