DSpace Repository

Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam

Show simple item record

dc.contributor.advisor Mendoza Morales, Luis, Director
dc.contributor.author Crespo Pinancela, Gustavo Javier
dc.contributor.author Veliz Moncada, Susana Maria
dc.creator Espol
dc.date.accessioned 2018-11-29T15:29:03Z
dc.date.available 2018-11-29T15:29:03Z
dc.date.issued 2012
dc.identifier.citation Crespo Pinancela, Gustavo Javier; Veliz Moncada, Susana Maria (2012). Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam. Trabajo final para la obtención del título: Ingeniero en Ciencias Computacionales Especialización Sistemas de Información. Espol.Fiec, Guayaquil. 68p.
dc.identifier.uri http://www.dspace.espol.edu.ec/xmlui/handle/123456789/45649
dc.description Este proyecto propone un modelo de análisis de los archivos que sigan el formato de un correo electrónico, según la norma RFC822 con el fin de determinar posibles mensajes spam. Para el filtrado de los mismos hemos utilizado la plataforma Apache Hadoop junto con la plataforma para analizar grandes cantidades de datos en un lenguaje de alto nivel Apache Pig. Para este estudio, obtuvimos una cantidad predeterminada de correos con y sin spam. Se realizó un análisis utilizando la metodología de filtros bayesianos aplicados a los mensajes electrónicas introducida por el ensayista, programador, diseñador de lenguajes y co-fundadador de viaweb Paul Graham, en modo stand alone así como en multinodo para ver las diferencias de tiempos de ejecución con uno y varios computadores. El conocimiento previo de la cantidad exacta de spam nos permitió determinar el grado de exactitud de nuestro filtro.
dc.format application/pdf
dc.format.extent 68
dc.language.iso spa
dc.publisher Espol
dc.rights openAccess
dc.subject HTML
dc.subject MENSAJES ELECTRONICOS
dc.subject HADOOP
dc.subject WEB SPAM
dc.title Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam
dc.type bachelorThesis
dc.identifier.codigoespol D-83398
dc.description.city Guayaquil
dc.description.degree Ingeniero en Ciencias Computacionales Especialización Sistemas de Información


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account