Resumen:
La detección temprana y precisa de enfermedades cardiovasculares es fundamental para la prevención y tratamiento efectivo de estas condiciones de salud crítica. En esta tesis, se exploró el uso de modelos de aprendizaje automático para mejorar la detección de enfermedades cardiovasculares, centrándose en la optimización del rendimiento del modelo. Se contó con una data de más de 300000 registros de factores de riesgo cardiovascular que mediante el software libre Orange Data Mining facilitó la carga, exploración y comprensión de los datos antes del entrenamiento. Además, de proporcionar los evaluadores de rendimiento entre los modelos seleccionados. Luego de la optimización del modelo más prometedor, mediante técnicas de preprocesamiento, balanceo de clases y validación cruzada, Regresión Logística pasó de un recall de 0.06 a
0.79 a la clase minoritaria. Al combinar estas estrategias, se mejoró la capacidad del modelo para detectar de manera equitativa tanto casos positivos como negativos de enfermedad cardiovascular.