Descripción:
La predicción de la producción de pozos petroleros es crucial para optimizar operaciones y reducir costos en la industria petrolera. Esta tesis se centra en desarrollar un modelo predictivo utilizando análisis de series temporales y modelos de regresión para pronosticar la producción de pozos en la arena U inferior del Campo Sacha ? BLOQUE 60 ubicado en la provincia de Orellana, Ecuador. El modelo incorpora datos históricos de producción desde 2014 hasta 2024, donde el periodo 2013 - 2021 se utilizó para entrenamiento y el año 2022 para validación de los modelos, con el objetivo de evaluar la producción futura para los años 2023-2024. El proyecto emplea el modelo SARIMAX (Modelo Autorregresivo Integrado de Media Móvil Estacional con Regresores Exógenos), que es particularmente adecuado para manejar los patrones estacionales y las variables exógenas que influyen en la producción de petróleo. Además, se evaluaron varios modelos de regresión, con XGBOOST logrando el mejor desempeño durante la validación, alcanzando un 98% de eficiencia según la métrica de R², mientras que SARIMAX alcanzó un 72%. Sin embargo, en la evaluación del período 2023- 2024, el modelo SARIMAX mostró un rendimiento óptimo mayor a Random Forest en un 53%. Los resultados demuestran la efectividad tanto del modelo SARIMAX como de Random Forest en la predicción de períodos de tiempo discontinuos, considerando las brechas en los datos y proporcionando información útil para ingenieros de campo. Esta propuesta no solo mejoraría la precisión de las predicciones, sino que también ayudaría en la planificación estratégica y la asignación de recursos en el proceso de extracción de petróleo. Palabras claves: predicción de producción, modelos de regresión, series temporales, extracción de petróleo.