
handle: 2117/445246
Este Trabajo de Fin de Grado tiene como objetivo desarrollar modelos predictivos para detectar de forma temprana el abandono en estudios universitarios, aplicando técnicas de aprendizaje automático sobre una base de datos real con información académica, demográfica y socioeconómica de estudiantes universitarios. Se ha seguido la metodología CRISP-DM, cubriendo todas sus fases hasta la evaluación de modelos, con el propósito de construir una herramienta útil para la toma de decisiones institucionales. Se aplicaron dos algoritmos de clasificación supervisada: regresión logística y random forest, entrenando modelos en dos momentos del curso (tras el primer y el segundo semestre) para evaluar la viabilidad de una detección temprana sin comprometer la precisión. Para mejorar el rendimiento en un contexto de clases desbalanceadas, se utilizaron técnicas de sobremuestreo y optimización de hiperparámetros, priorizando la sensibilidad (recall) como métrica principal. Los resultados muestran que ya tras el primer semestre se alcanza un recall elevado, lo que confirma la viabilidad de una detección anticipada. Las variables más relevantes fueron académicas (como la nota media y asignaturas aprobadas), seguidas por factores administrativos. Los modelos de regresión logística ofrecieron mejores resultados que los de random forest por su mayor capacidad de generalización ante variables predictoras marcadamente informativas. Este trabajo demuestra el valor del análisis de datos como apoyo a la equidad educativa, al facilitar la identificación temprana de estudiantes en riesgo y permitir la implementación de medidas preventivas.
Àrees temàtiques de la UPC::Matemàtiques i estadística, Machine learning, Aprenentatge automàtic, Estudiants universitaris, College students, Àrees temàtiques de la UPC::Ensenyament i aprenentatge::Ensenyament universitari
Àrees temàtiques de la UPC::Matemàtiques i estadística, Machine learning, Aprenentatge automàtic, Estudiants universitaris, College students, Àrees temàtiques de la UPC::Ensenyament i aprenentatge::Ensenyament universitari
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
