Der Suchmaschinenriese Google hat am Mittwoch Gemini 2.0 vorgestellt, ein experimentelles Modell, das eigenständig Websites nutzen kann und im Grunde ein Modell „für alles“ ist
Laut Google-CEO Sundar Pichai ermöglicht das neueste Modell Nutzern die Entwicklung neuer KI-Agenten, die „uns unserer Vision eines universellen Assistenten näherbringen“. Das Unternehmen bezeichnet sein Modell als sein bisher leistungsfähigstes Modell für das Zeitalter der KI-Agenten.
Die Initiativen sind Teil der Bemühungen des Unternehmens, sich im verschärften Wettbewerb der Technologiebranche gegen Konkurrenten wie Meta, Microsoft und Meta zu behaupten.
Google wird das Modell produktübergreifend einführen
Pichai stellte außerdem das neueste Modell vor, dessen multimodale Funktionen in allen Produkten des Unternehmens, einschließlich nativer Bild- und Audioausgabe, eingeführt werden sollen. Der Suchmaschinenriese hatte im Dezember letzten Jahres Gemini 1.0 vorgestellt, das laut Google das erste „nativ multimodale“ Modell war. Dies deutet darauf hin, dass das Modell Text-, Video-, Bild-, Audio- und Codeanfragen verarbeiten und beantworten kann.
Die neueste Version stellt Googles jüngste Bemühungen im zunehmend wettbewerbsintensiven KI-Wettlauf der Technologiebranche dar.
„Wenn es bei Gemini 1.0 um das Organisieren und Verstehen von Informationen ging, geht es bei Gemini 2.0 darum, diese Informationen viel nützlicher zu machen.“
Pichai.
Gemini 2.0 erscheint fast 10 Monate nach der Markteinführung von Gemini 1.5 durch Google. Laut Google befindet sich das Modell noch in der experimentellen Vorschauphase; bisher wurde nur eine Version des Modells veröffentlicht, das kleinere und leistungsschwächere 2.0 Flash.
Demis Hassabis, CEO von Google DeepMind und Leiter der KI-Aktivitäten des Unternehmens, sagte, dies sei dennoch ein großer Tag für den Technologiegiganten.
„Es ist genauso gut wie das aktuelle Pro-Modell. Man kann es also als eine ganze Stufe besser betrachten, bei gleicher Kosten- und Leistungseffizienz sowie Geschwindigkeit. Wir sind damit sehr zufrieden“, erklärte Hassabis.
Aktuell erhalten nur Entwickler und Tester als Erste die Version 2.0, während andere Gemini-Nutzer Zugriff auf das experimentelle Flash-Modell 2.0 haben, das auf Flash 1.5 aufbaut, welches als schnellstes und kostengünstigstes Modell auf den Markt gebracht wurde.
Google hat eine Reihe neuer Funktionen angekündigt
Laut Unternehmensangaben sollen die Analysefähigkeiten des neuen Modells in die Funktion „KI-Übersichten“ integriert werden, die laut Pichai bereits einer Milliarde Nutzern zur Verfügung steht. Er deutete an, dass diese Funktion zu den beliebtesten Suchfunktionen des Konzerns zählt.
Mit diesem neuen Modell hob Pichai außerdem hervor, dass AI Overviews nun in der Lage sein werden, komplexe mehrstufige Anfragen zu bearbeiten, beispielsweisematicGleichungen und multimodale Fragestellungen.
Während die Tests für das neueste Modell in dieser Woche in begrenztem Umfang begonnen haben, wird die Logikfunktion erst Anfang nächsten Jahres mehr Nutzern zur Verfügung stehen.
6. des Suchmaschinenriesen , Trillium, der seit Mittwoch auch für Google Cloud-Kunden verfügbar ist.
In seinem Blogbeitrag gab Google bekannt, dass der neue Chip eine viermal bessere Leistung bietet und 67 % energieeffizienter ist als sein Vorgänger.
Wir starten mit Gemini 2.0 Flash in die Gemini 2.0-Ära. Es übertrifft 1.5 Pro in wichtigen Benchmarks mit doppelter Geschwindigkeit (siehe Grafik unten). Besonders freue ich mich über die rasanten Fortschritte beim Codieren – und es wird noch mehr kommen.
Entwickler können eine experimentelle Version in AI ausprobieren… pic.twitter.com/iEAV8dzkaW
— Sundar Pichai (@sundarpichai) 11. Dezember 2024
Der Google-CEO kündigte außerdem weitere Funktionen an, darunter die neue Gemini-Funktion „Deep Research“, die mithilfe fortschrittlicher Schlussfolgerungs- und Kontextanalyse als Rechercheassistent fungiert. Diese neue Funktion ist in Gemini Advanced verfügbar und kann im Auftrag des Nutzers Rechercheberichte erstellen.
Hassabis sagte, dass Gemini 2.0 den Grundstein für ein großartiges Jahr 2025 lege.
„Wir sehen das Jahr 2025 als den eigentlichen Beginn des agentenbasierten Zeitalters.“
Hassabis.
Dies geschieht zeitgleich mit der Ankündigung des Unternehmens, ein weiteres Produkt auf den Markt zu bringen: Project Mariner , eine experimentelle neue Chrome-Erweiterung, die buchstäblich einen Webbrowser für die Benutzer nutzen kann.
Darüber hinaus kündigte Google auch Jules an – einen Agenten, der speziell dafür entwickelt wurde, Entwicklern zu helfen, fehlerhaften Code zu finden und zu beheben – sowie einen neuen, auf Gemini 2.0 basierenden Agenten, der die Bildschirme der Nutzer analysieren und ihnen helfen kann, Videospiele besser zu spielen.
Laut Hassabis deutet der Spielagent, den er als „Easter Egg“ bezeichnet, darauf hin, dass es tatsächlich multimodal ist.

