Please use this identifier to cite or link to this item: http://www.dspace.espol.edu.ec/handle/123456789/45649
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorMendoza Morales, Luis, Director-
dc.contributor.authorCrespo Pinancela, Gustavo Javier-
dc.contributor.authorVeliz Moncada, Susana Maria-
dc.creatorEspol-
dc.date.accessioned2018-11-29T15:29:03Z-
dc.date.available2018-11-29T15:29:03Z-
dc.date.issued2012-
dc.identifier.citationCrespo Pinancela, Gustavo Javier; Veliz Moncada, Susana Maria (2012). Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam. Trabajo final para la obtención del título: Ingeniero en Ciencias Computacionales Especialización Sistemas de Información. Espol.Fiec, Guayaquil. 68p.-
dc.identifier.urihttp://www.dspace.espol.edu.ec/xmlui/handle/123456789/45649-
dc.descriptionEste proyecto propone un modelo de análisis de los archivos que sigan el formato de un correo electrónico, según la norma RFC822 con el fin de determinar posibles mensajes spam. Para el filtrado de los mismos hemos utilizado la plataforma Apache Hadoop junto con la plataforma para analizar grandes cantidades de datos en un lenguaje de alto nivel Apache Pig. Para este estudio, obtuvimos una cantidad predeterminada de correos con y sin spam. Se realizó un análisis utilizando la metodología de filtros bayesianos aplicados a los mensajes electrónicas introducida por el ensayista, programador, diseñador de lenguajes y co-fundadador de viaweb Paul Graham, en modo stand alone así como en multinodo para ver las diferencias de tiempos de ejecución con uno y varios computadores. El conocimiento previo de la cantidad exacta de spam nos permitió determinar el grado de exactitud de nuestro filtro.-
dc.formatapplication/pdf-
dc.format.extent68-
dc.language.isospa-
dc.publisherEspol-
dc.rightsopenAccess-
dc.subjectHTML-
dc.subjectMENSAJES ELECTRONICOS-
dc.subjectHADOOP-
dc.subjectWEB SPAM-
dc.titleUtilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam-
dc.typebachelorThesis-
dc.identifier.codigoespolD-83398-
dc.description.cityGuayaquil-
dc.description.degreeIngeniero en Ciencias Computacionales Especialización Sistemas de Información-
Appears in Collections:Tesis de Computación

Files in This Item:
File SizeFormat 
D-83398.pdf3.56 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.