Por favor, use este identificador para citar o enlazar este ítem: http://www.dspace.espol.edu.ec/handle/123456789/8701
Título : Wݷikigrep distribuido: búsquedas avanzadas en la wikipedia
Autor : Varas Palomeque, Irene Carolina
Paladines Herrera, Gabriel Antonio
Fecha de publicación : 12-ene-2010
Resumen : En este proyecto se ha elaborado un motor de búsqueda que soporta expresiones regulares y cuyo repositorio de datos es la Wikipedia la enciclopedia libre, el sistema permite el ingreso de una expresión regular y por medio de un requerimiento asíncrono inicializa un clúster EC2, hace el grep dentro de todos los documentos y cuando obtiene la respuesta muestra a manera de lista los resultados, cada línea contiene el patrón encontrado y un enlace a la página de la Wikipedia del artículo. En el desarrollo de este proyecto se hace uso de los servicios de Amazon, de librerías desarrolladas en java para la manipulación de páginas de la Wikipedia, Hadoop framework y los datasets previamente cargados en Amazon. Se realizaron pruebas de búsquedas con varias expresiones regulares, estas búsquedas no fueron posibles de realizar en los motores de búsqueda tradicionales, ni en el motor de búsqueda de la propia Wikipedia, puesto que las expresiones regulares buscan texto que siga un patrón y no un texto específico. Las pruebas realizadas muestran que un sistema de búsquedas avanzadas puede ser implementado con un bajo costo y alta escalabilidad utilizando servicios de cloud computing y procesamiento masivo de datos.
URI : http://www.dspace.espol.edu.ec/handle/123456789/8701
Aparece en las colecciones: Tesis de Grado - FIEC

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
D-42427.pdfTesis en Adobe Acrobat542.04 kBAdobe PDFVisualizar/Abrir
presentacionWikigrepV3.pptxPresentacion en Power Point de la tesis1.21 MBMicrosoft Powerpoint XMLVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.