Resumen:
La creación de nuevos productos de seguros de vida que se ajusten a todas las
distantes clases económicas del país, resulta ser un mercado nuevo que necesita la
aplicación de modelos estadísticos que minimicen la cantidad de siniestros, esto
permite que las compañías aseguradoras puedan ofrecer sus productos sin llegar a
afectar la rentabilidad de esta. En el presente documento, se describe la aplicación
de modelos de aprendizaje automático para estimar un scoring de seguros de vida,
el cual consiste en clasificar por niveles de riesgo a los individuos de acuerdo con su
probabilidad de fallecer, modelando datos con variables de tipo clínico que revelen el
historial clínico del posible asegurado.
Se utilizaron técnicas de balanceo de la muestra para evitar el sesgo de prevalencia
de alguna clase, tales como: resampling y validación cruzada. Se evaluará y se
seleccionará los modelos con métricas como sensibilidad, especificidad, precisión y
exactitud del modelo. Además, para la identificación de perfiles de riesgos y
segmentos de clientes, se utilizó el análisis factorial mixto y clustering para variables
cualitativas y cuantitativas.
Finalmente, se seleccionó al modelo de regresión logística como el modelo que
mejores métricas de evaluación y selección obtuvo, y se estableció la tabla estimada
de descuento del valor de la prima de acuerdo con el punto de corte óptimo calculado
del modelo seleccionado.