Resumen:
This study presents a machine-learning approach to characterize the origin of electrical
outages in an urban area on Ecuador’s coastal region. The objective is to classify events into
internally scheduled, internally unscheduled, externally scheduled, and externally unscheduled
categories and to identify spatial patterns and associated factors; the hypothesis is that
combining operational, network, temporal, climatic, and socio-economic variables enables
accurate discrimination, justified by its usefulness for distribution-system management.
Historical outage records from a power-distribution utility for 2023 and 2024 were compiled,
and twelve predictive variables were integrated. Supervised classifiers, Random Forest and a
multilayer perceptron, were trained with stratified validation and precision, recall, and F1
metrics; georeferencing was performed for the study city. Random Forest achieved an overall
accuracy close to 99 %, and the MLP around 99.7 %, with higher performance for classes
with greater support. The results confirm that the taxonomy of outage origin is separable
using the twelve variables considered, and that geospatial visualization and prioritization by
substation and sector provide useful inputs for planning and mitigation.
Keywords: Machine Learning; Distribution System; Electrical Outages; Georeferencing;
Coastal Ecuador.
Descripción:
Se presenta un estudio para caracterizar el origen de las desconexiones eléctricas en una
zona urbana del litoral del Ecuador mediante aprendizaje automático. El objetivo es clasificar
eventos en interna programada, interna no programada, externa programada y externa no
programada e identificar patrones espaciales y factores asociados; se plantea como hipótesis
que la combinación de variables operativas, de red, temporales, climáticas y de contexto
socioeconómico permite discriminar dichas clases con precisión, justificándose por su utilidad
para la gestión del sistema de distribución. Se compiló el histórico de interrupciones de
una distribuidora de energía eléctrica en los años 2023 y 2024 y se integraron 12 variables
predictoras. Se entrenaron clasificadores supervisados, Random Forest y Perceptrón Multicapa,
con validación estratificada y métricas de precisión, recall y F1; la georreferenciación se efectuó
sobre la ciudad de estudio. Random Forest alcanzó una precisión global cercana al 99% y
la red MLP alrededor del 99.7 %, con mejor desempeño en clases de mayor soporte. Los
resultados confirman que la taxonomía del origen de las interrupciones es separable con las
12 variables consideradas y que la visualización geoespacial y la priorización por subestación
y sector proveen insumos útiles para planificación y mitigación.