Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores

Pérez Jaime, Steeven Fabricio; Mogro Ponce, Joan Fernando; González Narváez, Mariela, Directora

Please use this identifier to cite or link to this item: http://www.dspace.espol.edu.ec/handle/123456789/54267

Full metadata record

DC Field	Value	Language
dc.contributor.author	Pérez Jaime, Steeven Fabricio	-
dc.contributor.author	Mogro Ponce, Joan Fernando	-
dc.contributor.author	González Narváez, Mariela, Directora	-
dc.date.accessioned	2022-06-09T20:54:44Z	-
dc.date.available	2022-06-09T20:54:44Z	-
dc.date.issued	2021	-
dc.identifier.citation	Pérez, S.; Mogro, J. (2021). Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores.[Tesis]. Escuela Superior Politécnica del Litoral.	es_EC
dc.identifier.uri	http://www.dspace.espol.edu.ec/handle/123456789/54267	-
dc.description.abstract	Cuando dentro de una población se busca estudiar los diferentes aspectos sociales y económicos además de los factores que los provocan, las encuestas a hogares son la más usuales fuentes de información para la obtención de datos socieconómicos y demográficos. La recopilación de estos datos comúnmente se lo realiza de forma manual y está sujeta a errores en la operación, esto puede ser un generador de sesgos que al final del proceso nos podrían ofrecer una información errónea de lo que queremos investigar. Por esto se ha hace precisa la implementación de técnicas que identifiquen estos sesgos para acciones inmediatas y que no afecten al resultado final del estudio. Una opción para la detección de estos, son métodos manuales y ordinarios como se ha venido haciendo, sin embargo con el fin de mejorar la productividad de esta validación de datos hemos optado por la utilización de técnicas de Machine Learning optimizando estos procesos con la oportunidad de mejorar la detección de estos errores muestrales. En este estudio se ejecutan técnicas de Machine Learning a partir del uso de datos de encuestas realizadas a hogares. Se hicieron pruebas con algoritmos de aprendizaje supervisado. También realizamos un análisis exploratorio con los datos donde incluimos una distribución de variables por encuestador para identificar en cuál de ellos no se sigue el patrón y por lo consiguiente se generaría el sesgo, todo esto previo al modelado. El mejor modelo fue el de Random Forest con una precisión del 0.8579 que quizás no fue la mejor entre todos los modelos, pero demostró una buena proporción entre la sensibilidad de 0.7530 y la especificidad del 0.9628, esto indica una adecuada capacidad de detección de verdaderos positivos.	es_EC
dc.language.iso	es	es_EC
dc.publisher	ESPOL. FCNM	es_EC
dc.subject	Datos socioeconómicos	es_EC
dc.subject	Datos demográficos	es_EC
dc.subject	Error muestral	es_EC
dc.subject	Encuesta de hogares	es_EC
dc.title	Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores	es_EC
dc.type	Thesis	es_EC
Appears in Collections:	Tesis de Ingeniería en Estadística Informática

Files in This Item:

File	Description	Size	Format
T-110312 STEEVEN PEREZ Y JOAN MOGRO.pdf		1.68 MB	Adobe PDF	View/Open

Show simple item record