Descripción:
La deserción estudiantil es un problema no menor para una unidad de postgrado objeto de estudio del presente proyecto, problema que afecta al área financiera, sus estándares de calidad y al ámbito académico. El objetivo principal de este proyecto es diseñar un modelo predictivo de la deserción estudiantil. Durante el desarrollo de este proyecto integrador se tomaron en cuenta cuatro modelos de clasificación que son: Potenciación del Gradiente Estocástico (GBM), Bosques Aleatorios (RF), Redes Neuronales (NNET) y Regresión Logística (GLM); además, se utilizó la metodología KDD (Descubrimiento de Conocimiento en Bases de Datos) cuyas etapas especificadas de forma clara permiten la implementación correcta de los modelos estadísticos en conjunto con técnicas computacionales con el fin de obtener el óptimo desempeño de los mismo. Para definir el mejor modelo se evaluó cuantitativamente cada uno de ellos por medio de la matriz de confusión, sus indicadores de desempeño, la curva ROC y el AUC