Arcila-Calderón, Carlos, Barbosa-Caro, Eduar and Cabezuelo-Lorenzo, Francisco Técnicas big data: análisis de textos a gran escala para la investigación científica y periodística. El profesional de la información, 2016, vol. 25, n. 4, pp. 623-631. [Journal article (Paginated)]
Preview |
Text (Research article)
EPI_2016_25_4.pdf.pdf - Published version Available under License Creative Commons Attribution. Download (3MB) | Preview |
English abstract
Big data techniques: Large-scale text analysis for scientific and journalistic research. This paper conceptualizes the term big data and describes its relevance in social research and journalistic practices. We explain large-scale text analysis techniques such as automated content analysis, data mining, machine learning, topic modeling, and sentiment analysis, which may help scientific discovery in social sciences and news production in journalism. We explain the required e-infrastructure for big data analysis with the use of cloud computing and we asses the use of the main packages and libraries for information retrieval and analysis in commercial software and programming languages such as Python or R
Spanish abstract
Este trabajo conceptualiza el término big data y describe su importancia en el campo de la investigación científica en ciencias sociales y en las prácticas periodísticas. Se explican técnicas de análisis de datos textuales a gran escala como el análisis automatizado de contenidos, la minería de datos (data mining), el aprendizaje automatizado (machine learning), el modelamiento de temas (topic modeling) y el análisis de sentimientos (sentiment analysis), que pueden servir para la generación de conocimiento en ciencias sociales y de noticias en periodismo. Se expone cuál es la infraestructura necesaria para el análisis de big data a través del despliegue de centros de cómputo distribuido y se valora el uso de las principales herramientas para la obtención de información a través de software comerciales y de paquetes de programación como Python o R
Item type: | Journal article (Paginated) |
---|---|
Keywords: | Datos; Big data; Minería de datos; Aprendizaje automático; Modelamiento de temas; Análisis de sentimientos; Data; Big data; Data mining; Machine learning; Topic modeling; Sentiment analysis. |
Subjects: | H. Information sources, supports, channels. > HP. e-resources. H. Information sources, supports, channels. > HQ. Web pages. I. Information treatment for information services > IM. Open data L. Information technology and library technology > LK. Software methodologies and engineering. L. Information technology and library technology > LM. Automatic text retrieval. |
Depositing user: | Almudena Aguilera-Montenegro |
Date deposited: | 09 Mar 2019 14:17 |
Last modified: | 09 Mar 2019 14:17 |
URI: | http://hdl.handle.net/10760/34193 |
References
Downloads
Downloads per month over past year
Actions (login required)
View Item |