Por favor, use este identificador para citar o enlazar este ítem:
http://www.dspace.espol.edu.ec/handle/123456789/14734
Título : | Sistema para el análisis y procesamiento de los LOGS de los servidores de red de la Facultad de Ingeniería en Electricidad y Computación (FIEC) de la ESPOL usando HADOOP |
Autor : | Vaca, Carmen, Directora Guartatanga Robayo, Josué Jefferson Espinosa Daquilema, Eddy Roberto |
Palabras clave : | SISTEMA PARA EL ANÁLISIS Y PROCESAMIENTO DE LOS LOGS SERVIDORES DE RED DE LA FACULTAD DE INGENIERÍA EN ELECTRICIDAD Y COMPUTACIÓN |
Fecha de publicación : | 2010 |
Editorial : | ESPOL. FIEC |
Citación : | Guartatanga, J; Espinosa, E. (2010). Sistema para el análisis y procesamiento de los LOGS de los servidores de red de la Facultad de Ingeniería en Electricidad y Computación (FIEC) de la ESPOL usando HADOOP [Tesis de Grado]. Escuela Superior Politécnica del Litoral. FIEC, Guayaquil. 72p. |
Resumen : | El propósito de este proyecto es implementar un sistema que permita el análisis y procesamiento de los logs de los servidores de red del laboratorio de la Facultad de Ingeniería en Electricidad y Computación (FIEC) de la ESPOL. Estos logs son de gran tamaño por lo que resulta indispensable utilizar una plataforma de procesamiento masivo y escalable de datos, para ello se ha usado el framework Hadoop. El documento está dividido en 6 capítulos que comprenden el planteamiento del problema, el marco teórico, el análisis del problema con su respectivo diseño de la solución, la implementación y análisis de los resultados, las pruebas realizadas y posteriormente las conclusiones y recomendaciones. En el primer capítulo se define la problemática actual, se indican los objetivos y justificación del proyecto, así como también el alcance del mismo. En el segundo capítulo se expone el marco teórico utilizado para este trabajo, se explican conceptos como: la plataforma Hadoop, el modelo MapReduce, Hive como una herramienta de consultas y los servicios web ofertados por Amazon usados para las pruebas. El tercer capítulo explica el diseño de la solución del problema. En este capítulo se establecen las responsabilidades que tendrá cada uno de los componentes en los que ha sido dividido el proyecto, así como los datos de entrada y salida que se manejarán en cada etapa. En el cuarto capítulo se explican los detalles considerados en el código usado para la implementación y el funcionamiento del sistema. Se enfatiza también en el manejo de los diferentes formatos encontrados en los archivos de los logs procesados. El quinto capítulo describe las pruebas realizadas utilizando los servicios web de Amazon (Amazon Web Services). Como resultado de las pruebas se incluyen gráficos sobre el tiempo requerido para procesar los datos utilizando diferentes cantidades de nodos. Finalmente en el sexto capítulo se presentan las conclusiones obtenidas, y se plantean recomendaciones para futuros trabajos relacionados. |
URI : | http://www.dspace.espol.edu.ec/handle/123456789/14734 |
Aparece en las colecciones: | Tesis de Computación |
Ficheros en este ítem:
Fichero | Tamaño | Formato | |
---|---|---|---|
T-83240 GUARTATANGA-ESPINOSA.pdf | 1.47 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.