Please use this identifier to cite or link to this item: http://www.dspace.espol.edu.ec/handle/123456789/20795
Title: Sistema de reportes y análisis sobre tendencias en la web de la ESPOL usando hadoop para el procesamiento masivo de los datos.
Authors: Gallardo, Luis
Bermeo, Fabricio
Cedeño, Vanessa Msc.
Keywords: SISTEMAS DE REPORTES Y ANÁLISIS
HADOOP
WORDCOUNT
GRÁFICOS ESTADÍSTICOS
Issue Date: 9-May-2012
Abstract: Los sistemas de reportes y análisis sobre tendencias son ampliamente utilizados hoy en día gracias a su capacidad de analizar las palabras más usadas por los usuarios en la web, por ejemplo se han usado estos sistemas en las redes sociales, ya que las mismas en los últimos años han tenido gran acogida. En la web de la ESPOL existe una gran cantidad de datos, y no existe una herramienta que permita recolectarlos y realizar un análisis de su contenido, para resolver este problema usamos Hadoop que es una plataforma que nos permite desarrollar aplicaciones que tengan que tratar con grandes cantidades de datos, hasta petabytes. Los programas MapReduce de Hadoop están diseñados para computar grandes volúmenes de datos en paralelo. El ejemplo más claro de esto, lo que va a ser de gran ayuda y que se usa para este tipo de problemas es el WordCount, que lee archivos de texto y cuenta con qué frecuencia ocurren las palabras, como resultado final vamos a tener gráficos estadísticos para analizar las tendencias.
URI: http://www.dspace.espol.edu.ec/handle/123456789/20795
Appears in Collections:Artículos de Tesis de Grado - FIEC

Files in This Item:
File Description SizeFormat 
luis-fabricio.pdf203.34 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.