Resumen:
El diseño de un aplicativo web que permita predecir producción de petróleo, teniendo como base los datos del campo Volve localizado en Noruega. Este conjunto de datos es parte fundamental para la aplicación de la ciencia de datos y del Machine Learning, ya que se relacionan directamente con diversos lenguajes de programación, y con múltiples algoritmos de analítica predictiva.
El proyecto inició con un análisis exploratorio de datos o EDA por sus siglas en inglés, donde el conjunto de datos original fue manipulado con el objetivo de obtener sus principales características. Posteriormente, el conjunto de datos original fue expuesto a una reducción en su dimensionalidad con ayuda de criterios y procesos como el de correlación entre variables, eliminación de datos categóricos, innecesarios o incongruentes para su normalización previo al entrenamiento de los modelos predictivos. Mediante una exhaustiva revisión bibliográfica, regresión lineal, regresión polinomial, ARIMA y Random Forest fueron los cuatro algoritmos seleccionados que fundamentarían las bases de nuestros modelos predictivos.
De los algoritmos mencionados y utilizados para predecir producción, obtuvimos como resultado que el modelo basado en regresión polinomial y Random Forest obtuvieron una precisión general de 0.92 y 0.96 respectivamente. Aunque el mejor desempeño dentro del aplicativo web llamado “Saviour” definitivamente lo tiene Random Forest, ya que, al no ser tan susceptible a valores atípicos dentro de un marco de datos, arroja predicciones mucho más confiables.
Saviour es un aplicativo web gratuito, cuya única función es predecir producción de petróleo y aunque no presente mayores ventajas en comparación con los modelos físicos tradicionales tiene dos importantes virtudes por encima del resto, el ahorro de tiempo y dinero para las compañías. Demostrando de esta manera que el tener conocimiento de ciencia de datos y Machine Learning es muy importante para resolver problemas de cualquier tipo dentro de la industria de petróleo y gas.