OpenAI hat angekündigt, sein Flaggschiffmodell GPT-4.1 in ChatGPT einzuführen. Das Modell steht allen zahlenden Nutzern und Teammitgliedern über das Dropdown-Menü der Modellauswahl zur Verfügung. Kostenlose Nutzer sind von der Einführung ausgeschlossen, Enterprise- und Edu-Nutzer hingegen erhalten Zugriff.
GPT-4.0 mini wird für alle Nutzer, einschließlich kostenloser Konten, durch GPT-4.1 mini ersetzt. Auch Nutzer mit kostenpflichtigen Abonnements sehen das GPT-4.1 mini-Modell in ihrem Dropdown-Menü.
Laut OpenAI sind GPT-4.1 mini und GPT-4.1 für Codierungsaufgaben optimiert und reagieren schneller auf Anweisungen als GPT-4.0.
OpenAIs GPT-4.1 ist GPT-4.0 in allen Belangen überlegen
Laut OpenAI bietet das GPT-4.1-Modell ein größeres Kontextfenster, das bis zu einer Million Kontext-Token unterstützt und den Kontext bei längerem Textverständnis besser nutzen kann. Das KI-Unternehmen fügte hinzu, dass Softwareentwickler von der Verwendung des Modells bei der Entwicklung von Webanwendungen profitieren werden.
Aus den Versionshinweisen von OpenAI ging hervor, dass Ingenieure das Modell nutzen können, um alltägliche Abfragen, Folgefragen, Codierungen und andere komplexe Aufgaben auszuführen.
Das von Sam Altman geleitete KI-Unternehmen gab bekannt, dass das GPT-4.1-Modell im Vergleich zu GPT-4.0 (Limit: 128.000 Token) deutlich größere Mengen an Text, Bildern und Videos verarbeiten kann. Laut OpenAI erreichte GPT-4.1 im SWE-bench-Verifizierungstest 54,6 % und verbesserte sich damit um 21,4 % gegenüber GPT-4.0 und um 26,6 % gegenüber GPT-4.5. Dies macht es zum führenden Modell für Programmieraufgaben.
Im MultiChallenge-Benchmark von Scale, einem Test zur Messung der Fähigkeit, Anweisungen zu befolgen, erzielte GPT-4.1 38,3 %, eine Steigerung von 10,5 % gegenüber GPT-4.0. Auch im Video-MME-Benchmark, einem Test zum Verständnis multimodaler, längerer Kontexte, erreichte GPT-4.1 in der Kategorie „Lange Videos ohne Untertitel“ einen sehr hohen Wert von 72,0 %, was einer Verbesserung von 6,7 % gegenüber GPT-4.0 entspricht.
OpenAI gab bekannt, dass Benchmarks wertvolle Erkenntnisse liefern und dass die Modelle mit Fokus auf reale Anwendungen trainiert wurden. Das Unternehmen bedankte sich bei der Entwicklergemeinschaft für die Optimierung der Modelle für komplexe Aufgaben.
GPT-4.1 wird ohne Sicherheitsbericht geliefert
Die KI-Forschungsgemeinschaft kritisierte OpenAI dafür, das GPT-4.1-Modell ohne Sicherheitsbericht veröffentlicht zu haben, und behauptete, dass die Transparenzstandards für die Modelle von OpenAI gesenkt worden seien.
Das KI-Unternehmen argumentierte, dass das Modell zwar eine höhere Leistung und Geschwindigkeit als GPT-4.0 biete, aber im Gegensatz zu fortgeschritteneren Modellen keine Sicherheitsberichte benötige, da es nicht das Spitzenmodell sei.
„GPT-4.1 führt keine neuen Modalitäten oder Interaktionsmöglichkeiten mit dem Modell ein und übertrifft GPT-03 in puncto Intelligenz nicht. Das bedeutet, dass die Sicherheitsaspekte hier zwar erheblich sind, sich aber von denen fortschrittlicherer Modelle unterscheiden.“
– Johannes Heidecke , Leiter Sicherheit bei Open AI
Als Reaktion auf die Sicherheitsbedenken veröffentlichte das KI-Technologieunternehmen weitere Informationen zu GPT-4.1. Am Mittwoch verpflichtete sich das Unternehmen, die Ergebnisse seiner internen Sicherheitsbewertungen des Modells umgehend zu veröffentlichen, um die Transparenz zu erhöhen.
Das Unternehmen gab bekannt, dass es sich bemüht, sich in einem zunehmend wettbewerbsintensiven Markt zu profilieren. Berichten zufolge steht kurz vor der Bekanntgabe der 3 Milliarden Dollar schweren Übernahme von Windsurf, einem der bekanntesten KI-Programmierwerkzeuge. Windsurf konkurriert mit Cursor, einem weiteren beliebten KI-Programmierwerkzeug, sowie mit bestehenden KI-Programmierfunktionen von Unternehmen wie Microsoft und Anthropic.
Andrej Karpathy, ein ehemaliger Gründer von OpenAI, erklärte, Windsurf sei ein Tool, das Entwickler in den letzten Monaten verstärkt genutzt hätten, um schnell Code für neue Software zu erstellen. Zu den Investoren des Startups gehören Founders Fund, General Catalyst, Greenoaks und Kleiner Perkins.
Google hat seinerseits seinen Gemini-Chatbot aktualisiert, um die Anbindung an GitHub-Projekte zu vereinfachen. Diese GitHub-Integration folgt auf die Veröffentlichung eines GitHub-Connectors durch OpenAI für ChatGPT Deep Research. Das Tool durchsucht das Web und andere Quellen, um einen umfassenden Forschungsbericht zu einem Thema zu erstellen.
Am Dienstag begrüßte OpenAI außerdem SharePoint- und Microsoft OneDrive-Konnektoren für die ChatGPT-Tiefenforschung.
Foto von Focal Foto via Flickr.