Resumen:
En la actualidad las venta del sector alimentario en el Ecuador está en constante crecimiento,
especialmente en la industria de comercio minorista, debido a esto, los pronósticos de ventas
constituyen un factor de alto interés para mejorar la competitividad dentro de las industrias. Para
modelizar el comportamiento de compras individuales de los clientes y sus características de
grupos, se recurre a las técnicas multivariantes de clusterización usando el método K-means
y la caracterización mediante el método CHAID, que ayudan a simular el comportamiento
real de ventas, que es uno de los problemas principales en los modelos de pronósticos. A
partir de estas técnicas se identificaron se determinaron 7 segmentos de clientes homogéneos
con características de compras similares que ayudaron a la identificación de variables
relevantes para la generación de pronósticos de ventas más confiables y precisos a nivel de
categorías por número de ordenes procesadas. Mediante la utilización de aprendizaje
estadístico, utilizamos los modelos de pronósticos: regresión lineal, K-vecinos más cercanos
(KNN) y Árboles de regresión. Los resultados de los pronósticos mostraron que el mejor
modelo para ajustar los datos para las categorías de los distintos segmentos de clientes es el
modelo de Regresión lineal, presentando medidas de errores más bajas en cuanto a MAPE y
RMSE con relación a las medidas presentadas por los modelos KNN y Árboles de regresión,
obteniendo resultados sobresalientes especialmente en laa categorías Papel Higiénico del
segmento de clientes C con un MAPE apenas del 2,77% y un MAPE de 3,14% en la categoría
Toallas Húmedas.