Descripción:
El proyecto busca abordar el desafío de procesar y reconocer caracteres en formularios manuscritos provenientes de hospitales. Dada la variabilidad de la escritura de cada individuo, la interpretación manual de estos formularios es complicada y susceptible a errores. Se propuso el uso de un modelo de inteligencia artificial, Transformers, para reconocer y clasificar estos caracteres, con el objetivo de transformar datos manuscritos en texto digital, facilitando su procesamiento y almacenamiento en bases de datos. El estudio adquiere relevancia por su vinculación con el Objetivo de Desarrollo Sostenible (ODS) 3, pues la digitalización precisa de registros médicos puede mejorar la gestión y análisis de datos en el sector salud, reduciendo errores humanos y optimizando la atención médica. El conjunto de datos utilizado consta de 4999 formularios manuscritos recopilados de varias regiones de la ZONAL 8. Se empleó el modelo TrOCR para el reconocimiento de texto. En términos de resultados, se recopilaron formularios de siete zonas distintas, con Guayas y Manabí aportando la mayor cantidad. El proceso de entrenamiento del modelo incluyó diversos parámetros y técnicas. La pérdida de prueba alcanzada fue del 34,42%, y el Error de Tasa de Caracteres (CER) fue del 6,91%. En conclusión, se logra un considerable avance hacia la digitalización precisa de textos manuscritos. Aunque la precisión alcanzada es destacable, aún hay margen de mejora, especialmente en la reducción del CER. Este trabajo tiene el potencial de transformar la forma en que se procesan y almacenan datos manuscritos en el sector salud.