Descripción:
Esta tesis presenta una serie de técnicas basadas en CNN aplicadas a imágenes para abordar los problemas de estimación de la pose de la cámara y del cuerpo humano a partir de entornos multivistas. Para la estimación de la pose de la cámara, se han propuesto dos enfoques basados en la arquitectura siamesa para estimar los parámetros extrínsecos de la pose de la cámara. El primer enfoque toma como entrada un conjunto de pares de imágenes reales, que deben tener un solapamiento mínimo para asegurar que los pares de imágenes tienen características comunes. Sin embargo, debido a los pocos conjuntos de datos de imágenes reales disponibles para la estimación de la pose de la cámara en escenarios multivista, se propone un segundo enfoque. Este consiste en una estrategia de adaptación del dominio, que incluye la generación de diferentes escenarios virtuales mediante un software especial desimulación3D.La estrategia se utiliza para aprovechar la transferencia del conocimiento aprendido de estos escenarios virtuales a los escenarios del mundo real. Para el problema de estimación de la postura del cuerpo humano, también se proponen dos enfoques. El primero, una arquitectura basada en una red neuronal convolucional, que aprovecha los parámetros extrínsecos estimados para establecer la relación entre las diferentes cámaras en el esquema multivista. Esto ha permitido estimar la pose del cuerpo humano utilizando información de diferentes puntos de vista, y así, resolver el desafiante problema de la auto-oclusión en la estimación de la pose humana debido a la pose natural del cuerpo. También se ha propuesto un segundo enfoque para el problema de la estimación de la pose del cuerpo humano. Este utiliza módulos de atención para detectar las articulaciones del cuerpo. Sin embargo, a diferencia del primer enfoque, este nuevo enfoque no tiene encuenta los parámetros extrínsecos entre las diferentes cámaras del esquema multivista, sino que se utiliza la posición y la orientación de los huesos del cuerpo humano como información adicional para abordar el problema de la auto-oclusión de las articulaciones del cuerpo humano. La precisión de estas estimaciones es importante para evitar posibles falsas alarmas en los sistemas de análisis del comportamiento de las ciudades inteligentes, así como en aplicaciones de fisioterapia y asistencia para el desplazamiento seguro de personas mayores, entre otras.