Descripción:
En el contexto de la pandemia por COVID-19, la detección temprana sigue siendo un desafío para contener la propagación de virus y mitigar la presión sobre los sistemas de salud. Sin embargo, los métodos de diagnóstico convencionales presentan limitaciones en términos de accesibilidad, costo y tiempo de procesamiento. En respuesta a estas limitaciones, este trabajo propone un sistema basado en redes neuronales convolucionales para la clasificación de señales acústicas de toses, con el objetivo de desarrollar una alternativa no invasiva, rápida y de bajo costo. El sistema desarrollado empleó el dataset crowdsourced CoughVid, junto con los conjuntos de datos COVID-19 Cough Recording y Virufy Data Set, los cuales fueron preprocesados y transformados en representaciones espectrales mediante espectrogramas de Mel y cromagramas. Se evaluaron dos modelos de redes neuronales: CoughNet, basado únicamente en características escalares, y CoughNetwithCNN, que integra información espectral con capas convolucionales. Los modelos fueron optimizados mediante validación cruzada (k-fold) y búsqueda de hiperparámetros, incorporando técnicas de regularización como dropout y early stopping para evitar el sobreajuste. Los resultados demostraron que el modelo híbrido CoughNetwithCNN alcanzó una exactitud promedio de entrenamiento del 96.48% y una exactitud en prueba del 87.27%, superando a CoughNet y a clasificadores tradicionales como Naïve Bayes, Support Vector Machines y Random Forest. Además, se evidenció que la combinación de características escalares y representaciones espectrales mejora significativamente la capacidad del modelo para diferenciar entre toses de pacientes positivos y negativos para COVID-19. Este estudio sugiere que el uso de redes neuronales en el análisis de audio tiene el potencial de complementar los métodos de diagnóstico convencionales, ofreciendo una solución accesible y escalable para la detección temprana de enfermedades respiratorias. Keywords: COVID-19, Redes Neuronales Convolucionales, Análisis de Audio, Diagnóstico Automatizado, Aprendizaje Profundo