Forschern der Universität Surrey ist ein bahnbrechender Erfolg im Bereich der künstlichen Intelligenz (KI) gelungen: Sie haben ein System trainiert, die dreidimensionale (3D) Pose von Hunden anhand zweidimensionaler (2D) Bilder vorherzusagen. Unter der Leitung der Doktorandin dent Shooter nutzte das Team einen innovativen Ansatz, der vielfältige Anwendungsmöglichkeiten eröffnet – von der Ökologie bis zur Animation.
In einem bahnbrechenden Schritt nutzten die Forscher die virtuelle Welt des beliebten Videospiels Grand Theft Auto, um eine Vielzahl virtueller Hunde zu erschaffen. Durch Modifikationen des Spiels ersetzten sie die Hauptfigur durch acht verschiedene Hunderassen und generierten so eine Fülle digitaler Hundeverhaltensweisen. Dieses Projekt, genannt DigiDogs, lieferte einen umfangreichen Datensatz mit 27.900 Einzelbildern, die verschiedene Hundeaktivitäten wie Sitzen, Gehen, Bellen und Rennen unter unterschiedlichen Umgebungsbedingungen festhielten.
KI-Training auf DigiDogs: Ein Quantensprung in den Vorhersagefähigkeiten
Traditionell werden KI-Systeme darin geschult, 3D-Informationen aus 2D-Bildern zu erkennen, indem man ihnen Wissen über die 3D-„Grundwahrheit“ vermittelt. Dies wird typischerweise mithilfe von Motion-Capture-Anzügen für Menschen erreicht. Die Übertragung dieses Ansatzes auf Hunde stellte jedoch eine besondere Herausforderung dar. Unbeirrt nutzten die Forscher den DigiDogs-Datensatz, um ihr KI-Modell zu trainieren und so das Fehlen von Bewegungsdaten von Hunden zu überwinden.
Frau Shooter betonte die Vielseitigkeit ihrer Lösung und nannte Anwendungsmöglichkeiten von der Wildtierpflege bis zur Entwicklung virtueller Welten. Das KI-Modell, das zunächst mit computergenerierten Hunden trainiert wurde, zeigt das Potenzial, 3D-Skelettmodelle aus realen Tierfotos zu extrapolieren. Diese Fähigkeit ist vielversprechend für verschiedene Bereiche: Sie ermöglicht es Naturschützern, verletzte Wildtiere zudent, und gibt Künstlern die Möglichkeit, lebensechtere Tiere in virtuellen Umgebungen zu erschaffen.
Zukünftige Ausrichtungen
Das Forschungsteam arbeitet daran, sein KI-System mithilfe des DINOv2-Modells von Meta weiterzuentwickeln und so die präzise Vorhersage von 3D-Posen anhand realer Hundebilder zu gewährleisten. Durch die Verknüpfung virtueller und realer Daten wollen sie die Leistungsfähigkeit des Modells steigern und dessen Anwendbarkeit auf verschiedene Szenarien erweitern. Frau Shooter betonte den Informationsreichtum, der in 3D-Posen steckt, und unterstrich deren Überlegenheit gegenüber 2D-Fotografien.
Die Pionierarbeit der Universität Surrey verdeutlicht das transformative Potenzial der KI-Technologie in Verbindung mit innovativen Ansätzen und interdisziplinärer Zusammenarbeit. Da sich KI dank Fortschritten bei der Datenerfassung und zunehmender algorithmischer Raffinesse stetig weiterentwickelt, scheinen die Möglichkeiten, unser Verständnis der Welt zu erweitern und sie für praktische Anwendungen zu nutzen, grenzenlos.
Die Verschmelzung von virtueller Simulation, KI und realen Daten birgt das Potenzial, zahlreiche Bereiche – vom Naturschutz bis zur Unterhaltung – grundlegend zu verändern. Die Forschung der Universität Surrey stellt einen bedeutenden Fortschritt bei der Erschließung der Vorhersagefähigkeiten von KI dar und markiert einen Meilenstein im Bestreben, Technologie zur Bewältigung komplexer Herausforderungen und zur Erschließung neuer Möglichkeiten zu nutzen. Mit fortgesetzter Innovation und Zusammenarbeit birgt die KI ein immenses Potenzial, unsere Welt nachhaltig zum Besseren zu verändern.

