Mostrar el registro sencillo del ítem
dc.contributor.advisor | Menéndez Campos, Jessica , Director | |
dc.contributor.author | Castillo Zurita, Benjamin Israel | |
dc.contributor.author | Silva Tacuri, Karla Andrea | |
dc.creator | ESPOL | |
dc.date.accessioned | 2023-10-26T14:06:24Z | |
dc.date.available | 2023-10-26T14:06:24Z | |
dc.date.issued | 2023 | |
dc.identifier.citation | Castillo Zurita, B. I. y Silva Tacuri, K. A. (2023). Aplicación de un modelo Deep Learning para la lectura automática de caracteres manuscritos en formularios estadísticos físicos, usando la arquitectura de redes neuronales Transformers. [Proyecto integrador]. ESPOL.FCNM . | |
dc.identifier.uri | http://www.dspace.espol.edu.ec/handle/123456789/58484 | |
dc.description | El proyecto busca abordar el desafío de procesar y reconocer caracteres en formularios manuscritos provenientes de hospitales. Dada la variabilidad de la escritura de cada individuo, la interpretación manual de estos formularios es complicada y susceptible a errores. Se propuso el uso de un modelo de inteligencia artificial, Transformers, para reconocer y clasificar estos caracteres, con el objetivo de transformar datos manuscritos en texto digital, facilitando su procesamiento y almacenamiento en bases de datos. El estudio adquiere relevancia por su vinculación con el Objetivo de Desarrollo Sostenible (ODS) 3, pues la digitalización precisa de registros médicos puede mejorar la gestión y análisis de datos en el sector salud, reduciendo errores humanos y optimizando la atención médica. El conjunto de datos utilizado consta de 4999 formularios manuscritos recopilados de varias regiones de la ZONAL 8. Se empleó el modelo TrOCR para el reconocimiento de texto. En términos de resultados, se recopilaron formularios de siete zonas distintas, con Guayas y Manabí aportando la mayor cantidad. El proceso de entrenamiento del modelo incluyó diversos parámetros y técnicas. La pérdida de prueba alcanzada fue del 34,42%, y el Error de Tasa de Caracteres (CER) fue del 6,91%. En conclusión, se logra un considerable avance hacia la digitalización precisa de textos manuscritos. Aunque la precisión alcanzada es destacable, aún hay margen de mejora, especialmente en la reducción del CER. Este trabajo tiene el potencial de transformar la forma en que se procesan y almacenan datos manuscritos en el sector salud. | |
dc.format | application/pdf | |
dc.format.extent | 42 paginas | |
dc.language.iso | spa | |
dc.publisher | ESPOL | |
dc.rights | openAccess | |
dc.subject | Transformers | |
dc.subject | Reconocimiento manuscrito | |
dc.subject | Digitalización | |
dc.subject | Formularios médicos | |
dc.subject | Objetivo de Desarrollo Sostenible (ODS) | |
dc.title | Aplicación de un modelo Deep Learning para la lectura automática de caracteres manuscritos en formularios estadísticos físicos, usando la arquitectura de redes neuronales Transformers | |
dc.type | Ingeniero Estadístico | |
dc.identifier.codigoespol | T-110524 | |
dc.description.city | Guayaquil | |
dc.description.degree | Escuela Superior Politécnica del Litoral | |
dc.identifier.codigoproyectointegrador | MATE-165 | |
dc.description.abstractenglish | The project aims to address the challenge of processing and recognizing characters in handwritten forms. Given the variability in each individual's writing, the manual interpretation of these forms is complex and prone to errors. The use of an artificial intelligence model, Transformers, was proposed to recognize and classify these characters, with the goal of transforming handwritten data into digital text, facilitating its processing and storage in databases. The study gains significance due to its connection with Sustainable Development Goal (SDG) 3, as precise digitization of medical records can enhance data management and analysis in the health sector, reducing human errors and optimizing medical care. The dataset used consists of 4999 handwritten forms collected from various regions of ZONAL 8. The TrOCR model was employed for text recognition. In terms of results, forms were collected from seven distinct zones, with Guayas and Manabí contributing the most. The training process of the model included various parameters and techniques. The test loss achieved was 34.42%, and the Character Error Rate (CER) was 6.91%. In conclusion, significant progress has been made towards the precise digitization of handwritten texts. Although the accuracy achieved is noteworthy, there is still room for improvement, especially in reducing the CER. This work has the potential to transform the way handwritten data is processed and stored in the health sector. |