Resumen:
La demanda de ancho de banda de internet ha aumentado considerablemente en los últimos años, debido al alto consumo de contenido multimedia en plataformas como Netflix, Spotify, entre otros, y acentuado por la pandemia del COVID-19. La consecuencia más notable del aumento en la demanda de este recurso es la congestión en las salidas internacionales de red de un ISP, que provoca latencia e indisponibilidad del servicio de internet. Existen diferentes alternativas para solucionar la congestión, tales como, contratar más capacidad internacional o utilizar soluciones especializadas de hardware o software. El presente proyecto propone el uso de aprendizaje por refuerzo, para determinar que acciones realizar para resolver la congestión, reduciendo el tiempo de afectación y minimizando el impacto. Mediante el algoritmo SARSA se plantea el desarrollo de un modelo que utilice la información de la topología de red de un proveedor de internet, el número de enlaces, la región geográfica y el ancho de banda para optimizar la toma de decisiones y permitir la posible automatización del proceso. De acuerdo con los resultados, los tiempos de resolución disminuyen considerablemente, por lo tanto, la probabilidad de superar un umbral máximo de resolución especificado en contratos de servicios también disminuye, evitando así multas. Por lo que, se puede concluir que el uso del modelo beneficia al proveedor de internet.