Investigadores de la Universidad de Surrey han logrado un hito revolucionario en inteligencia artificial (IA): enseñar a un sistema a predecir la pose tridimensional (3D) de perros a partir de imágenes bidimensionales (2D). Dirigido por la estudiante de posgrado dent Shooter, el equipo utilizó un enfoque innovador que abre las puertas a diversas aplicaciones, desde la ecología hasta la animación.
En una iniciativa pionera, los investigadores recurrieron al mundo virtual del popular videojuego Grand Theft Auto para crear una gran variedad de perros virtuales. Modificando el juego, sustituyeron al personaje principal por ocho razas diferentes de perros, generando una gran cantidad de comportamientos caninos digitales. Esta iniciativa, denominada DigiDogs, proporcionó un completo conjunto de datos compuesto por 27 900 fotogramas que capturaban diversas actividades caninas, como sentarse, caminar, ladrar y correr, en diferentes condiciones ambientales.
Entrenamiento de IA en DigiDogs: un salto adelante en capacidades predictivas
Tradicionalmente, enseñar a los sistemas de IA a percibir información 3D a partir de imágenes 2D implicaba proporcionarles conocimiento sobre la realidad 3D, generalmente obtenida mediante trajes de captura de movimiento para humanos. Sin embargo, extender este enfoque a los perros presentó un desafío único. Sin desanimarse, los investigadores aprovecharon el conjunto de datos de DigiDogs para entrenar su modelo de IA, superando la falta de datos de captura de movimiento canino.
La Sra. Shooter destacó la versatilidad de su solución, imaginando aplicaciones que abarcan desde la conservación de la vida silvestre hasta el desarrollo de mundos virtuales. Inicialmente entrenado con perros CGI, el modelo de IA demuestra el potencial de extrapolar modelos esqueléticos 3D a partir de fotografías de animales reales. Esta capacidad es prometedora en diversos ámbitos, permitiendo a los conservacionistasdentanimales silvestres heridos y empoderando a los artistas para crear animales más realistas en entornos virtuales.
Direcciones futuras
De cara al futuro, el equipo de investigación busca perfeccionar su sistema de IA utilizando el modelo DINOv2 de Meta, garantizando así su capacidad para predecir poses 3D con precisión a partir de imágenes reales de perros. Al reducir la brecha entre los datos virtuales y los reales, aspiran a mejorar el rendimiento del modelo y ampliar su aplicabilidad en diversos escenarios. La Sra. Shooter destacó la riqueza de información que contienen las poses 3D, destacando su superioridad sobre las fotografías 2D.
El trabajo pionero de la Universidad de Surrey ejemplifica el potencial transformador de la tecnología de IA cuando se combina con enfoques innovadores y colaboración interdisciplinaria. A medida que la IA continúa evolucionando, impulsada por los avances en la adquisición de datos y la sofisticación algorítmica, las posibilidades de mejorar nuestra comprensión del mundo y aprovecharla para aplicaciones prácticas parecen ilimitadas.
La convergencia de la simulación virtual, la IA y los datos del mundo real promete revolucionar numerosos campos, desde la conservación de la vida silvestre hasta el entretenimiento. La investigación de la Universidad de Surrey representa un avance significativo en el desarrollo de las capacidades predictivas de la IA, marcando un hito en la búsqueda del uso de la tecnología para abordar desafíos complejos y generar nuevas oportunidades. Con innovación y colaboración continuas, el futuro de la IA alberga un inmenso potencial para transformar nuestro mundo para mejor.

