Descripción:
Las redes neuronales son modelos matemáticos con una capacidad de generalización
extraordinaria y misteriosa.
Son capaces de resolver tareas complejas como reconocer actividades en un video,
clasificar imágenes, o traducir de un lenguae a otro. Sin embargo, el fundamento de
los modelos suele ser empírico y no matemático.
Este proyecto se desvia de la tendencia y propone una red neuronal recurrente para
reconocer actividades en un video; pero justificada en intuiciones matemáticas.
La arquitectura propuesta (denominada D-RNN) logra resultados de clasificación
comparables a una LSTM (arquitectura recurrente más común para reconocer
actividades), pero con 0.68% de los parámetros. Convirtiendose en una alternativa
viable cuando el porcentaje de error puede sacrificarse por un modelo más liviano.
Adicionalmente, se desmitifica a las redes neuronales y a TensorFlow. El capítulo dos
y los anexos elaboran en los temas respectivamente, y cada uno construye una base
teórica para sustentar las ideas que se plantean.
En resumen, el capítulo uno da una visión general del problema a resolver, el capítulo
dos explica las redes neuronales y las redes neuronales recurrentes, el capítulo tres
explica la solución propuesta, y el capítulo cuatro analiza los resultados. En los anexos
se explica TensorFlow.