Analítica aplicada al Plan Nacional de Desarrollo 2022-2026: “Colombia, potencia mundial de la vida”
Analytics applied to the National Development Plan 2022-2026: "Colombia, world power of life"
Contenido principal del artículo
Resumen
Teniendo en cuenta la importancia de los planes de desarrollo para un país, y las dificultades de entender las propuestas de manera objetiva y neutra. Este artículo propone el análisis del PND 2022-2026: “Colombia, potencia mundial de la vida”, a través de la minería de texto. Los principales resultados fueron: la identificación de los 23 temas dentro del PND y los términos que incluyen. El término más importante es Colombia, seguido de paz, discapacidad, género y alimentos. Los dos primeros representan los temas con el mismo nombre. Siendo coherente con el eje transversal del PND, la consecución de la paz total en Colombia. Los otros tres términos están dentro de los temas de mujeres e inclusión, alimentación y mujeres, nuevamente. El análisis permitió la identificación de los bigramas y trigramas con mayor frecuencia en el PND. Siendo el más frecuente gobierno-nacional, mientras que el trigrama más frecuente es: plan-nacional-desarrollo. Este análisis evidencia que en el PND, la paz, las minorías, la alimentación, la educación, el transporte y los derechos humanos son protagonistas. La inversión es de los temas más relevantes en el PND. Los dos aspectos centrales del tema educación y salud se encuentran en una variedad de aspectos que hacen que su especificidad sea baja y su relevancia sea media. Sin embargo, es un tema transversal en el PND. Al revisar la correlación de los temas se observa que los temas fundamentales del PND son: infraestructura, paz, agua, desarrollo rural y cultura y recreación.
Detalles del artículo
Referencias (VER)
Al-Anazi, S., AlMahmoud, H. & Al-Turaiki, I. (2016). Finding similar documents using different clustering techniques. Procedia Computer Science, 82, 28-34. https://doi.org/10.1016/j.procs.2016.04.005
Arrieta Díaz, E. y Vargas Prieto, A. (2021). Analítica de datos aplicada al Plan Nacional de Desarrollo de 2018-2022, “Pacto por Colombia, pacto por la equidad”. Estudios Políticos, (62), 215-239. https://doi.org/10.17533/udea.espo.n62a09
Campello, R. J., Moulavi, D. & Sander, J. (2013, April 14-17). Density-based clustering based on hierarchical density estimates. In J. Pei, V. S. Tseng, L. Cao, H. Motoda, G. Xu (Eds.), Advances in Knowledge Discovery and Data Mining (pp. 160-172). 17th Pacific-Asia Conference, PAKDD, Gold Coast, Australia, Proceedings, Part II. https://doi.org/10.1007/978-3-642-37456-2_14
Clarke, G. M. & Cooke, D. (1978). A basic course in statistics (second edition). Grootendorst, M. (2022). BERTopic: Neural topic modeling with a class-based TF-IDF procedure. Arvix. https://arxiv.org/abs/2203.05794
Hagiwara, M. (2021). Real-world natural language processing: practical applications with deep learning. Manning Publications. Han, J., Kamber, M. & Pei, J. (2012). Data mining: Concepts and techniques (third edition). https://doi.org/10.1016/C2009-0-61819-5
Havrlant, L. & Kreinovich, V. (2017). A simple probabilistic explanation of term frequency-inverse document frequency (TF-IDF) heuristic (and variations motivated by this explanation). International Journal of General Systems, 46(1), 27-36. https://doi.org/10.1080/03081079.2017.1291635
IBM. (2023). What is data mining? https://www.ibm.com/topics/data-mining
Janasik, N., Honkela, T. & Bruun, H. (2009). Text mining in qualitative research: Application of an unsupervised learning method. Organizational Research Methods, 12(3), 436-460. https://doi.org/10.1177/1094428108317202
Kavitha, V. & Punithavalli, M. (2010). Clustering time series data stream - a literature survey. International Journal of Computer Science and Information Security, 8(1), 289-294. Murtagh, F. & Contreras, P. (2012). Algorithms for hierarchical clustering: An overview. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 2(1), 86-97. https://doi.org/10.1002/widm.53
Trstenjak, B., Mikac, S. & Donko, D. (2014). KNN with TF-IDF based framework for text categorization. Procedia Engineering, 69, 1356-1364. https://doi.org/10.1016/j.proeng.2014.03.129
Vargas Prieto, A. y Arrieta Díaz, E. (2024). Identificación y caracterización de los consejos territoriales de planeación en Colombia. Tendencias, 25(1), 109-138. https://doi.org/10.22267/rtend.242501.243
Vargas Prieto, A. y Camacho Quintero, M. A. (2023). El Plan Nacional de Desarrollo 2022-2026 desde el Consejo Nacional de Planeación. Departamento Nacional de Planeación. https://www.dnp.gov.co/publicaciones/Planeacion/Paginas/el-plan-nacional-de-desarrollo-2022-2026-desde-el-consejo-nacional-de-planeacion.aspx
Zapata-Cortés, O. L. (2020). Reflexión sobre los planes de desarrollo en Colombia. Bitácora Urbano Territorial, 30(3), 233-246. https://doi.org/10.15446/bitacora.v30n3.86811
Zhang, W., Yoshida, T. & Tang, X. (2011). A comparative study of TF*IDF, LSI and multi-words for text classification. Expert Systems with Applications, 38(3), 2758-2765. https://doi.org/10.1016/j.eswa.2010.08.066