Descripción:
La estereovisión, una técnica que genera información tridimensional a partir de imágenes 2D capturadas por dos cámaras, destaca por su capacidad de proporcionar representaciones 3D detalladas, aunque enfrenta desafíos técnicos como la calibración de cámaras, la rectificación de imágenes y la generación de mapas de disparidad para producir nubes de puntos con bajo ruido. Este proyecto se enfoca en desarrollar un sistema de estereovisión que combina métodos tradicionales y avanzados para generar mapas de disparidad y nubes de puntos 3D, validando y analizando su precisión mediante la medición de la altura de personas en la escena. Se implementaron técnicas tradicionales como SGBM y enfoques modernos basados en machine learning, como RAFT-Stereo y Selective-IGEV. El desarrollo también incluyó procesos de normalización y corrección dimensional para garantizar la coherencia y comparabilidad de las nubes de puntos generadas. Los resultados mostraron que RAFT-Stereo y Selective-IGEV tienden a crear una mejor representación visual de escenarios tridimensionales mientras que SGBM acompañado del filtro WLS, destaca por su precisión uniforme. Finalmente, se concluye que RAFT-Stereo y Selective-IGEV pueden competir en precisión con métodos avanzados basados en coincidencia de bloques como SGBM, y en ciertas aplicaciones, podrían superarlos, generando representaciones visuales tridimensionales superiores. Palabras Clave: Machine Learning, Mapas De Disparidad, Visión Por Computador, Análisis de Precisión.