Repositorio Dspace

Aplicación de un modelo Deep Learning para la lectura automática de caracteres manuscritos en formularios estadísticos físicos, usando la arquitectura de redes neuronales Transformers

Mostrar el registro sencillo del ítem

dc.contributor.advisor Menéndez Campos, Jessica , Director
dc.contributor.author Castillo Zurita, Benjamin Israel
dc.contributor.author Silva Tacuri, Karla Andrea
dc.creator ESPOL
dc.date.accessioned 2023-10-26T14:06:24Z
dc.date.available 2023-10-26T14:06:24Z
dc.date.issued 2023
dc.identifier.citation Castillo Zurita, B. I. y Silva Tacuri, K. A. (2023). Aplicación de un modelo Deep Learning para la lectura automática de caracteres manuscritos en formularios estadísticos físicos, usando la arquitectura de redes neuronales Transformers. [Proyecto integrador]. ESPOL.FCNM .
dc.identifier.uri http://www.dspace.espol.edu.ec/handle/123456789/58484
dc.description El proyecto busca abordar el desafío de procesar y reconocer caracteres en formularios manuscritos provenientes de hospitales. Dada la variabilidad de la escritura de cada individuo, la interpretación manual de estos formularios es complicada y susceptible a errores. Se propuso el uso de un modelo de inteligencia artificial, Transformers, para reconocer y clasificar estos caracteres, con el objetivo de transformar datos manuscritos en texto digital, facilitando su procesamiento y almacenamiento en bases de datos. El estudio adquiere relevancia por su vinculación con el Objetivo de Desarrollo Sostenible (ODS) 3, pues la digitalización precisa de registros médicos puede mejorar la gestión y análisis de datos en el sector salud, reduciendo errores humanos y optimizando la atención médica. El conjunto de datos utilizado consta de 4999 formularios manuscritos recopilados de varias regiones de la ZONAL 8. Se empleó el modelo TrOCR para el reconocimiento de texto. En términos de resultados, se recopilaron formularios de siete zonas distintas, con Guayas y Manabí aportando la mayor cantidad. El proceso de entrenamiento del modelo incluyó diversos parámetros y técnicas. La pérdida de prueba alcanzada fue del 34,42%, y el Error de Tasa de Caracteres (CER) fue del 6,91%. En conclusión, se logra un considerable avance hacia la digitalización precisa de textos manuscritos. Aunque la precisión alcanzada es destacable, aún hay margen de mejora, especialmente en la reducción del CER. Este trabajo tiene el potencial de transformar la forma en que se procesan y almacenan datos manuscritos en el sector salud.
dc.format application/pdf
dc.format.extent 42 paginas
dc.language.iso spa
dc.publisher ESPOL
dc.rights openAccess
dc.subject Transformers
dc.subject Reconocimiento manuscrito
dc.subject Digitalización
dc.subject Formularios médicos
dc.subject Objetivo de Desarrollo Sostenible (ODS)
dc.title Aplicación de un modelo Deep Learning para la lectura automática de caracteres manuscritos en formularios estadísticos físicos, usando la arquitectura de redes neuronales Transformers
dc.type Ingeniero Estadístico
dc.identifier.codigoespol T-110524
dc.description.city Guayaquil
dc.description.degree Escuela Superior Politécnica del Litoral
dc.identifier.codigoproyectointegrador MATE-165
dc.description.abstractenglish The project aims to address the challenge of processing and recognizing characters in handwritten forms. Given the variability in each individual's writing, the manual interpretation of these forms is complex and prone to errors. The use of an artificial intelligence model, Transformers, was proposed to recognize and classify these characters, with the goal of transforming handwritten data into digital text, facilitating its processing and storage in databases. The study gains significance due to its connection with Sustainable Development Goal (SDG) 3, as precise digitization of medical records can enhance data management and analysis in the health sector, reducing human errors and optimizing medical care. The dataset used consists of 4999 handwritten forms collected from various regions of ZONAL 8. The TrOCR model was employed for text recognition. In terms of results, forms were collected from seven distinct zones, with Guayas and Manabí contributing the most. The training process of the model included various parameters and techniques. The test loss achieved was 34.42%, and the Character Error Rate (CER) was 6.91%. In conclusion, significant progress has been made towards the precise digitization of handwritten texts. Although the accuracy achieved is noteworthy, there is still room for improvement, especially in reducing the CER. This work has the potential to transform the way handwritten data is processed and stored in the health sector.


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Buscar en DSpace


Búsqueda avanzada

Listar

Mi cuenta