Técnicas supervisadas de minería de datos para el análisis del rendimiento académico de los estudiantes de la Universidad Nacional Amazónica de Madre de Dios
DOI:
https://doi.org/10.55873/racba.v1i2.190Palabras clave:
CRISP, Data mining, Maquinas de soporte vectorial, reglas de asociación, técnicas predictivasResumen
El presente estudio tuvo como propósito identificar la técnica supervisada de minería de datos con mejor desempeño para el análisis del rendimiento académico de estudiantes universitarios. Se optó por el diseño no experimental de corte transversal. El conjunto de datos inicial para los experimentos estuvo conformado por 17771 registros de procesos académicos, tras el preprocesamiento se obtuvo un conjunto de datos final de 17035 registros. La metodología de minería de datos empleada fue Knowledge Discovery in Databases (KDD). Se emplearon las técnicas de regresión logística binaria, Classification and Regression Trees (CART), C4.5, Maquinas de soporte vectorial, K-vecinos más cercanos (k-Nearest Neighbors). Los resultados demuestran que el al algoritmo C5.0 obtiene una exactitud del 93%, AUC del 0.9797 y un tiempo de entrenamiento de 0.87 segundos, resultando ser el más eficiente en relación a los demás algoritmos comparados.
Citas
Asif, R., Merceron, A., Ali, S. A., & Haider, N. G. (2017). Analyzing undergraduate students’ performance using educational data mining. Computers & Education, 113, 177–194. https://doi.org/10.1016/J.COMPEDU.2017.05.007
Enke, D., & Thawornwong, S. (2005). The use of data mining and neural networks for forecasting stock market returns. Expert Systems with Applications, 29(4), 927–940. https://doi.org/10.1016/J.ESWA.2005.06.024
Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). Knowledge Discovery and Data Mining: Towards a Unifying Framework.
Garbanzo, G. M. (2007). Factores asociados al rendimiento académico en estudiantes universitarios. Revista Mexicana de Orientación Educativa, 31(1), 1–25. https://doi.org/10.31206/rmdo072018
Gironés, J., Casas, J., Minguillón, J., & Caihuelas, R. (2017). Minería de datos: modelos y algoritmos (UOC (ed.); Primera).
Han, J., Kamber, M., & Pei, J. (2012). Data Mining: Concepts and Techniques. In Data Mining: Concepts and Techniques. Elsevier Inc. https://doi.org/10.1016/C2009-0-61819-5
Khor, E. T. (2022). A data mining approach using machine learning algorithms for early detection of low-performing students. International Journal of Information and Learning Technology, 39(2), 122–132. https://doi.org/10.1108/IJILT-09-2021-0144
Landis, J. R., & Koch, G. G. (1977). An Application of Hierarchical Kappa-type Statistics in the Assessment of Majority Agreement among Multiple Observers. Biometrics, 33(2), 363. https://doi.org/10.2307/2529786
Lemay, D. J., Baek, C., & Doleck, T. (2021). Comparison of learning analytics and educational data mining: A topic modeling approach. Computers and Education: Artificial Intelligence, 2, 100016. https://doi.org/10.1016/J.CAEAI.2021.100016
Nabil, A., Seyam, M., & Elfetouh, A. A. (2022). Predicting students’ academic performance using machine learning techniques: a literature review. International Journal of Business Intelligence and Data Mining, 20(4), 456. https://doi.org/10.1504/IJBIDM.2022.123214
Norabuena, R. (2011). UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Universidad Nacional Mayor de San Marcos.
Rosado Gómez, A. A., & Verjel Ibáñez, A. (2015). Minería de datos aplicada a la demanda del transporte aéreo en Ocaña, Norte de Santander. Tecnura, 19(45), 101–113. https://doi.org/10.14483/UDISTRITAL.JOUR.TECNURA.2015.3.A08
Trakunphutthirak, R., & Lee, V. C. S. (2021). Application of Educational Data Mining Approach for Student Academic Performance Prediction Using Progressive Temporal Data: Https://Doi.Org/10.1177/07356331211048777, 60(3), 742–776. https://doi.org/10.1177/07356331211048777
Valcárcel, V. (2004). DATA MINING Y EL DESCUBRIMIENTO DEL CONOCIMIENTO (1)-9993 (electrónico). Revista de La Facultad de Ingeniería Industrial, 7(2), 1810.
Yağcı, M. (2022). Educational data mining: prediction of students’ academic performance using machine learning algorithms. Smart Learning Environments, 9(1). https://doi.org/10.1186/S40561-022-00192-Z
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2022 Nelly Ulloa-Gallardo, Luis Alberto Holgado-Apaza, Yban Vílchez-Navarro, Diego Raul Quispe-Barra
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.