Institutional Repositories as a Tool for Monitoring and Verifying the Sustainable Development Goals. Case Study: Argentina

Texier, Jose Institutional Repositories as a Tool for Monitoring and Verifying the Sustainable Development Goals. Case Study: Argentina., 2020 [Preprint]

[thumbnail of Principal]
Preview
Text (Principal)
Publicacion - Los RI & ODS (Ingles).pdf - Draft version
Available under License Creative Commons Attribution Non-commercial.

Download (214kB) | Preview
[thumbnail of Traduccion]
Preview
Text (Traduccion)
Publicacion - Los RI & ODS.pdf - Supplemental material
Available under License Creative Commons Attribution Non-commercial.

Download (230kB) | Preview

English abstract

The general objective of the system is the construction of an automatic classifier of resources of the National System of Digital Repositories in accordance with the 169 goals of the 17 Sustainable Development Goals (SDG) defined by the United Nations Organization. The classifier will consist of a computational development capable of analyzing different metadata (call it title, abstract, keywords and full text) applying text analysis techniques to establish a syntactic and/or semantic relationship with the ODS, which allows the end user to do use of the resources or items of the repository or repositories according to the classification achieved, that is, to date the institutional repositories. This line of research promotes a culture of sharing resources, linking people in similar academic and scientific research and activities, contributing to the generation of new knowledge and reducing the gaps that make it difficult to access information on topics related to the SDGs through the items deposited in Argentine Institutional Repositories. The work plan includes both basic research aspects (improvement and analysis of text processing algorithms), applied research (direct benefit of society on the subject of the SDGs) and field research (collection and availability of digital resources for all the repositories of Argentina for a specific purpose, researcher base research area), as well as knowledge transfer (the project could be integrated as a software component in the different types of existing repository software or as a software system of independently and external to IR).

Spanish abstract

El objetivo general del sistema es la construcción de un clasificador automático de recursos del Sistema Nacional de Repositorios Digitales de acuerdo con las 169 metas de los 17 Objetivos de Desarrollo Sostenible (ODS) definidos por la Organización de las Naciones Unidas. El clasificador consistirá en un desarrollo computacional capaz de analizar diferentes metadatos (llámense título, resumen, palabras clave y texto completo) aplicando técnicas del análisis de texto para establecer una relación sintáctica y/o semántica con los ODS, que le permita al usuario final hacer uso de los recursos o ítems del repositorio o repositorios de acuerdo con la clasificación lograda, es decir, datificar los repositorios institucionales. Esta línea de investigación promueve una cultura de compartición de recursos, vinculación de personas en actividades e investigaciones académicas y científicas similares, contribución a la generación de nuevos conocimientos y disminución de las brechas que dificultan el acceso de la información de temas relacionados con los ODS a través de los ítems depositados en Repositorios Institucionales Argentinos. El plan de trabajo contempla tanto aspectos de investigación básica (mejora y análisis de algoritmos de procesamiento de texto), investigación aplicada (beneficio directo de la sociedad sobre el tema de los ODS) e investigación de campo (recolección y disponibilidad de recursos digitales de todos los repositorios de la Argentina para un fín específico, área de investigación base de investigador), así como también transferencia de conocimiento (el proyecto podría integrarse como un componente de software en los diferentes tipos de software de repositorios existentes o como un sistema de software de manera independiente y externo a los RI).

Item type: Preprint
Keywords: natural language processing, SDG, RI, datification, Argentina
Subjects: A. Theoretical and general aspects of libraries and information. > AA. Library and information science as a field.
B. Information use and sociology of information > BZ. None of these, but in this section.
L. Information technology and library technology > LJ. Software.
L. Information technology and library technology > LL. Automated language processing.
L. Information technology and library technology > LM. Automatic text retrieval.
Depositing user: Jose Texier
Date deposited: 15 Feb 2021 23:07
Last modified: 15 Feb 2021 23:09
URI: http://hdl.handle.net/10760/40959

References

Acosta, O. L., Aguilar, C. A., & Infante, T. (2015). Reconocimiento de términos en español mediante la aplicación de un enfoque de comparación entre corpus. Linguamática, 7(2), 19-34.

Agarwal, A., Xie, B., Vovsha, I., Rambow, O., & Passonneau, R. (2011). Sentiment Analysis of Twitter Data. Proceedings of the Workshop on Languages in Social Media, 30–38.

Allen, C., Metternicht, G., & Wiedmann, T. (2018). Initial progress in implementing the Sustainable Development Goals (SDGs): A review of evidence from countries. Sustainability Science, 13(5), 1453–1467.

Alsaffar, D., Alfahhad, A., Alqhtani, B., Alamri, L., Alansari, S., Alqahtani, N., & Alboaneen, D. A. (2020). Machine and Deep Learning Algorithms for Twitter Spam Detection. En A. E. Hassanien, K. Shaalan, & M. F. Tolba (Eds.), Proceedings of the International Conference on Advanced Intelligent Systems and Informatics 2019 (pp. 483-491). Springer International Publishing. https://doi.org/10.1007/978-3-030-31129-2_44

Ambysoft Inc. Site Map. (2020). http://www.ambysoft.com/siteMap.html

Bird, S., Klein, E., & Loper, E. (2009). Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit. O’Reilly Media, Inc.

Buttigieg, P. L., McGlade, J., & Coppens, L. (2015). Clarifying terms in the SDGs: Representing the meaning behind the terminology [Miscellaneous]. 2nd Meeting of the Inter-Agency Expert Group on Sustainable Development Goal Indicators; United Nations Statistics Division.

COAR. (2020). Next Generation Repositories. Confederation of Open Access Repositories. https://www.coar-repositories.org/news-updates/what-we-do/next-generation-repositories/

European Commission. (2018). Turning FAIR into reality—Publications Office of the EU. https://doi.org/10.2777/1524

Felipe, C., Valbuena, N., & others. (2020). Índice ODS 2019 para América Latina y el Caribe. Centro de los Objetivos de Desarrollo Sostenible para América Latina y el Caribe. https://doi.org/hdl.handle.net/11520/25484

Galli, A., Leuenberger, A., Dietler, D., Fletcher, H. A., Junghanss, T., & Utzinger, J. (2020). Tropical Medicine and International Health and the 2030 Agenda for Sustainable Development. Tropical Medicine & International Health, 25(1), e1-e13. https://doi.org/10.1111/tmi.13368

Ganegedara, T. (2018). Natural Language Processing with TensorFlow: Teach language to machines using Python’s deep learning library. Packt Publishing Ltd.

Griffiths, M. D., Kuss, D. J., Billieux, J., & Pontes, H. M. (2016). The evolution of Internet addiction: A global perspective. Addictive behaviors, 53, 193–195.

Gupta, S., & Manning, C. D. (2011). Analyzing the Dynamics of Research by Extracting Key Aspects of Scientific Papers. IJCNLP.

Hurtado, J. (2008). Cómo formular objetivos de investigación (2da ed.). Fundación Sypal.

Jisc. (2020). OpenDOAR: Directory of Open Access Repositories. https://v2.sherpa.ac.uk/opendoar/

Jurafsky, D., & Martin, J. H. (2008). Speech and Language Processing. Upper Saddle River, NJ: Prentice Hall, 1039.

Karisma, F. (2018). Declaración de Panamá sobre Ciencia Abierta. https://web.karisma.org.co/DeclaracionDePanama/

Kramer, B., & Bosman, J. (2016). Innovations in scholarly communication—Global survey on research tool usage. F1000Research, 5. https://doi.org/10.12688/f1000research.8414.1

Koch, F., & Krellenberg, K. (2018). How to Contextualize SDG 11? Looking at Indicators for Sustainable Urban Development in Germany. ISPRS International Journal of Geo-Information, 7(12), 464. https://doi.org/10.3390/ijgi7120464

Körfgen, A., Förster, K., Glatz, I., Maier, S., Becsi, B., Meyer, A., Kromp-Kolb, H., & Stötter, J. (2018). It’s a Hit! Mapping Austrian Research Contributions to the Sustainable Development Goals. Sustainability, 10(9), 3295. https://doi.org/10.3390/su10093295

Körfgen, A., Glatz, I., Maier, S., Scherz, S., Kreiner, H., Passer, A., Allerberger, F., Kromp-Kolb, H., & Stötter, J. (2019). Austrian Universities and the Sustainable Development Goals. IOP Conference Series: Earth and Environmental Science, 323, 012156. https://doi.org/10.1088/1755-1315/323/1/012156

Lope Salvador, V., Vidal Bordes, J., & Mamaqi, X. (2020). La Inteligencia Artificial: Desafíos teóricos, formativos y comunicativos de la datificación. ICONO, 18(1). https://doi.org/ri14.v18i1.1434

López, J., Sánchez-Sánchez, C., & Villatoro-Tello, E. (2014). Laboratorio en línea para el procesamiento automático de documentos.

Lossio-Ventura, J. A., Jonquet, C., Roche, M., & Teisseire, M. (2014). Yet Another Ranking Function for Automatic Multiword Term Extraction. Advances in Natural Language Processing, 52-64. https://doi.org/10.1007/978-3-319-10888-9_6

Mann, W., & Thompson, S. (2009). Rhetorical Structure Theory: Toward a functional theory of text organization. Text - Interdisciplinary Journal for the Study of Discourse, 8(3), 243–281. https://doi.org/10.1515/text.1.1988.8.3.243

Marín, Á. L. G., & Lisbona, C. B. (2018). Datificación en los Archivos Digitales de los Medios de Comunicación: Nuevos Retos. Investigaciones en datificación de la era digital.

Markus, M. L. (2017). Datification, organizational strategy, and is research: What’s the score? The Journal of Strategic Information Systems, 26(3), 233–241.

Martínez Osés, P. J. (2020). Hacer realidad la Agenda: Medios de implementación, revisión y seguimiento. Transformar nuestro mundo,?` realidad o ficción?

Mayer-Schönberger, V., & Cukier, K. (2013). Big data: A revolution that will transform how we live, work, and think. Houghton Mifflin Harcourt.

Meschede, C. (2020). The Sustainable Development Goals in Scientific Literature: A Bibliometric Overview at the Meta-Level. Sustainability, 12(11), 4461. https://doi.org/10.3390/su12114461

Molina Gómez, N. I., Rodríguez, C. A., López, P. A., & Díaz Arévalo, J. L. (2019). Minería de texto y aprendizaje automático para identificar prioridades de desarrollo sostenible. Congreso Colombiano y Conferencia Internacional de Calidad de Aire y Salud Pública (CASP). https://doi.org/10.1109/CASAP.2019.8916682

Naciones Unidas. (2015). Resolución de la Asamblea General de las Naciones Unidas: A/RES/70/1. ONU. https://undocs.org/es/A/RES/70/1

Rajaraman, A., & Ullman, J. (2011). Mining of Massive Datasets | Guide books. Cambridge University Press. https://dl.acm.org/doi/book/10.5555/2124405

Ritter, A., Clark, S., Mausam, & Etzioni, O. (2011). Named Entity Recognition in Tweets: An Experimental Study. Proceedings of the Conference on Empirical Methods in Natural Language Processing, 1524–1534. http://dl.acm.org/citation.cfm?id=2145432.2145595

Rivera, S. J., Minsker, B. S., Work, D. B., & Roth, D. (2014). A text mining framework for advancing sustainability indicators. Environmental Modelling & Software, 62, 128-138. https://doi.org/10.1016/j.envsoft.2014.08.016

Stamatatos, E., Fakotakis, N., & Kokkinakis, G. (2000). A Practical Chunker for Unrestricted Text. En D. N. Christodoulakis (Ed.), Natural Language Processing—NLP 2000 (pp. 139-150). Springer. https://doi.org/10.1007/3-540-45154-4_13

Suber, P. (2012). Ensuring open access for publicly funded research. BMJ : British Medical Journal, 345. https://doi.org/10.1136/bmj.e5184

Sun, S., Luo, C., & Chen, J. (2017). A review of natural language processing techniques for opinion mining systems. Information Fusion, 36, 10-25. https://doi.org/10.1016/j.inffus.2016.10.004

Tascón, M. (2013). Introducción: Big Data. Pasado, presente y futuro. Telos: Cuadernos de comunicación e innovación, 95, 47-50.

Texier, J. (2015). La representación de recursos usando la metodología del Desarrollo Dirigido por Modelos en un repositorio institucional [Tesis, Facultad de Informática]. http://hdl.handle.net/10915/45635

Texier, J. (2013). Los repositorios institucionales y las bibliotecas digitales: Una somera revisión bibliográfica y su relación en la educación superior. 9. http://eprints.rclis.org/19925/

Texier, J., & Zambrano, J. (2019). La relación entre el Curriculum DL y las Ciencias de la Computación: Una revisión bibliográfica. Interciencia, 45 número 2. https://www.interciencia.net/wp-content/uploads/2020/03/01_6205_Com_Texier_v45n2_8.pdf

Texier, J., Zambrano, J., & Frati, F. E. (2017, octubre). Framework para el procesamiento lingüístico de artículos científicos. XXIII Congreso Argentino de Ciencias de la Computación (La Plata, 2017). http://sedici.unlp.edu.ar/handle/10915/63711

UNESCO. (2020, febrero 17). Open Science. UNESCO. https://en.unesco.org/science-sustainable-future/open-science

Vallez, M., & Pedraza, R. (2007). El Procesamiento del Lenguaje Natural en la Recuperación de Información Textual y áreas afines. Hipertext.Net. http://elis.da.ulcc.ac.uk/9973/

Vicente-Saez, R., & Martinez-Fuentes, C. (2018). Open Science now: A systematic literature review for an integrated definition. Journal of Business Research, 88, 428-436. https://doi.org/10.1016/j.jbusres.2017.12.043

Virmani, C., Pillai, A., & Juneja, D. (2017). Extracting Information from Social Network using NLP. International Journal of Computational Intelligence Research, 13(4), 621–630.

Ye, D., Xing, Z., Li, J., & Kapre, N. (2016). Software-specific Part-of-speech Tagging: An Experimental Study on Stack Overflow. Proceedings of the 31st Annual ACM Symposium on Applied Computing, 1378–1385. https://doi.org/10.1145/2851613.2851772

Yu, Y., & Wang, X. (2015). World Cup 2014 in the Twitter World: A big data analysis of sentiments in US sports fans’ tweets. Computers in Human Behavior, 48, 392–400.


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item