Google DeepMind stellt einen menschenähnlichen KI-Agenten vor, der in Echtzeit lernt und sich anpasst

- DeepMind hat seinen KI-Agenten SIMA 2 vorgestellt, der mit Googles Gemini-Modellen integriert werden kann
- Der KI-Agent kann in virtuellen Welten Anweisungen in menschlicher Sprache befolgen, seine Ziele berücksichtigen, mit Benutzern in Dialog treten und sich im Laufe der Zeit kontinuierlich verbessern.
- Der KI-Agent ermöglicht es den Nutzern, über Text, Sprache oder sogar Bilder mit ihm zu interagieren.
Google DeepMind hat am Donnerstag SIMA 2 vorgestellt – seinen KI-Agenten mit Denkvermögen, der sich laut Unternehmen in virtuellen Welten wie ein Mensch verhält. Das Technologieunternehmen erklärte, SIMA 2 helfe DeepMind, über einfache Aktionen auf dem Bildschirm hinauszugehen und eine KI zu entwickeln, die selbstständig plant, Erklärungen liefert und durch Erfahrung lernt.
Das Unternehmen erklärte, der Start markiere einen bedeutenden Schritt hin zu Künstlicher Allgemeiner Intelligenz (AGI). DeepMind warnte zudem, dass SIMA 2 wichtige allgemeine Auswirkungen auf die Zukunft der Robotik und die Verkörperung von KI habe.
SIMA 2 denkt selbstständig und handelt in interaktiven Umgebungen
SIMA 2 ist unser leistungsfähigster KI-Agent für virtuelle 3D-Welten. 👾🌐
Angetrieben von Gemini, geht es über das Befolgen einfacher Anweisungen hinaus: Es denkt, versteht und handelt in interaktiven Umgebungen – das heißt, Sie können per Text, Sprache oder sogar Bildern mit ihm kommunizieren. So geht's 🧵 pic.twitter.com/DuVWGJXW7W
— Google DeepMind (@GoogleDeepMind) 13. November 2025
Das Technologieunternehmen veröffentlichte im März die erste Version von SIMA (Scalable Instructable MultiWorld Agent). Laut Google erlernte der KI-Agent Hunderte von Grundfertigkeiten, indem er den Bildschirm beobachtete und virtuelle Tastatur- und Maussteuerung nutzte. Das Unternehmen bestätigte außerdem, dass die neueste Version des KI-Agenten noch einen Schritt weiter geht, indem sie der KI ermöglicht, selbstständig zu denken.
Google DeepMind gab außerdem bekannt, dass Gemini die Grundlage des KI-Agenten bildet. Das Technologieunternehmen erklärte, dass die Integration von SIMA 2 und Gemini dem KI-Agenten hilft, das übergeordnete Ziel eines Nutzers zu verstehen, komplexe Schlussfolgerungen zu ziehen und zielgerichtete Aktionen in Spielen geschickt auszuführen.
Das Unternehmen erklärte, SIMA 2 sei der leistungsfähigste KI-Agent für virtuelle 3D-Welten. DeepMind stellte fest, dass sich die Interaktion mit dem Agenten weniger wie das Erteilen von Befehlen anfühlte, sondern eher wie die Zusammenarbeit mit einem intelligenten Partner bei der Bewältigung der jeweiligen Aufgabe.
Laut Ankündigung geht SIMA 2 über das Befolgen einfacher Anweisungen hinaus und ermöglicht es dem System, in interaktiven Umgebungen zu denken, zu verstehen und zu handeln. Der KI-Agent erlaubt die Interaktion per Text, Sprache oder sogar Bildern.
Google erklärte, sein KI-Modell Gemini helfe SIMA 2 dabei, übergeordnete Ziele zu interpretieren und die geplanten Schritte zu erläutern. Das Unternehmen fügte hinzu, Gemini unterstütze den neuen, menschenzentrierten Agenten dabei, in Spielen mit einem Denkvermögen zu interagieren, das das ursprüngliche System nicht erreichen konnte.
Das Technologieunternehmen berichtete außerdem von einertronGeneralisierungsfähigkeit in virtuellen Umgebungen. DeepMind bestätigte, dass SIMA 2 längere und komplexere Aufgaben bewältigte, darunter Logikrätsel, Bildschirmzeichnungen und Emojis. Google erklärte, dass die Leistung von SIMA 2 dadurch bei einer Vielzahl von Aufgaben der eines menschlichen Spielers näherkomme. Das Unternehmen merkte zudem an, dass der KI-Agent eine Aufgabenabschlussrate von 65 % erreichte, verglichen mit 31 % bei SIMA 1.
DeepMind stellte fest, dass SIMA 2 Anweisungen interpretierte und in völlig neuen, von Genie 3 generierten 3D-Welten agierte. Das Projekt, das interaktive Umgebungen anhand eines einzelnen Bildes oder einer Texteingabe erstellt, wurde letztes Jahr veröffentlicht. Laut DeepMind konnte sich SIMA 2 in Welten, die es vor den Tests noch nie gesehen hatte, orientieren, Ziele verstehen und sinnvolle Aktionen ausführen.
Google argumentierte, dass der menschenzentrierte Agent nun deutlich besser darin sei, detaillierte Anweisungen auszuführen, selbst in Welten, die er noch nie zuvor erlebt habe. Das Unternehmen erklärte, SIMA 2 könne gelernte Konzepte von einem Spiel auf ein anderes übertragen und so Verbindungen zwischen ähnlichen Aufgaben herstellen.
DeepMind identifiziert Lücken in SIMA 2, die geschlossen werden müssen
Die Forscher stellten fest , dass der Agent nach dem Lernen durch menschliche Demonstrationen in selbstgesteuertes Spielen überging. Er nutzte Versuch und Irrtum sowie das von Gemini generierte Feedback, um neue Erfahrungsdaten zu erstellen. Diese neuen Erfahrungsdaten umfassen eine Trainingsschleife, in der SIMA 2 die generierten Aufgaben bearbeitete und seine eigenen Trajektoriendaten in die nächste Version des Modells einfließen ließ.
Obwohl DeepMind SIMA 2 als Fortschritt in der künstlichen Intelligenz feierte, deckte die Studie auch Lücken auf, die geschlossen werden müssen. Googledentebenfalls Schwachstellen, darunter die Arbeit mit einem begrenzten Speicherfenster, Schwierigkeiten bei sehr langen, mehrstufigen Aufgaben und Probleme bei der visuellen Interpretation, die in 3D-KI-Systemen auftreten.
DeepMind gab bekannt , dass SIMA 2 als Testumgebung für Fähigkeiten dient, die zukünftig in Robotik und Navigation eingesetzt werden könnten. Das Unternehmen erklärte, seine SIMA-2-Forschung ebnetronWeg für Anwendungen in der Robotik und auch für AGI in der realen Welt.
Wenn Sie einen ruhigeren Einstieg in die DeFi Kryptowährungen ohne den üblichen Hype wünschen, beginnen Sie mit diesem kostenlosen Video.
CRASH-KURS
- Mit welchen Kryptowährungen kann man Geld verdienen?
- Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
- Wenig bekannte Anlagestrategien, die Profis anwenden
- Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)














