OpenAI GPT-5 erhält am ersten Tag gemischte Kritiken

- OpenAI hat GPT-5 nach monatelangem Hype auf den Markt gebracht und große Fortschritte in den Bereichen logisches Denken, Codierung und Geschwindigkeit versprochen.
- Die ersten Rezensionen fallen gemischt aus: Einige loben die Fähigkeiten des Programms, andere bemängeln Fehler in Mathematik, Rechtschreibung und Logik.
- Die Nutzer kritisierten die geringere Transparenz und den Verlust älterer Modelle wie GPT-4o.
OpenAI-Chef Sam Altman hatte GPT-5 monatelang angekündigt. Er bezeichnete es als hochentwickeltes Modell – intelligenter, schneller und fähig, auf „Doktoranden-Niveau“ zu denken. Das Unternehmen positionierte die Veröffentlichung als wichtigen Fortschritt für ChatGPT – einen Schritt, der zu Verbesserungen der Intelligenz in den Bereichen Codierung, logisches Denken und Genauigkeit führen sollte.
Erste Reaktionen zeichnen jedoch ein uneinheitlicheres Bild. Entwickler lobten das Modell für sein Verständnis komplexer Eingabeaufforderungen und die Ausgabe gut strukturierten Codes. Der frühe Tester Simon Willison beschrieb GPT-5 als „kompetent“ und „gelegentlich beeindruckend“, aber nicht als einen großen Fortschritt gegenüber GPT-4. Andere waren weniger beeindruckt.
In den sozialen Medien kursierten schnell zahlreiche Beschwerden über sachliche Fehler, mangelnde mathematische Kenntnisse und – in einigen Fällen – sogar einfache Rechtschreibfehler. Noah Giansiracusa, Mathematikprofessor an der Bentley University, nannte die Veröffentlichung „enttäuschend“ und merkte an, dass die betreffenden Aktualisierungen „weniger bedeutend als erhofft“ seien
Ein Teil der Verwirrung lag in der Architektur des Modells. GPT-5 enthielt einen automatischen Umschalter für verschiedene Modellgrößen, je nach Aufgabe. Dies spart Rechenleistung und verhindert, dass man ständig mit dem gesamten GPT-5-Modell arbeiten muss, was vielen Nutzern zu Sicherheitslücken verhalf. Nachdem das System eine Frage falsch beantwortet hatte, wies der Agent, mit dem es zusammenarbeitete, es an, genauer darüber nachzudenken, wie viele „b“ in „Blueberry“ enthalten sind. Nach diesem Feedback gab es die richtige Antwort.
Die Nutzer wehren sich – und OpenAI reagiert
Die Frustration könnte sich bis Freitag auf Reddit und X entladen. Während einige Nutzer es bemängelten, dass sie nicht wussten, von wem oder welchem Modell der Text stammte, empfanden viele die Hölle als bloße Spekulation und GPT-5 als Ersatz für ihre bewährten Modelle. Einige wenige bemängelten die Qualität, die Schreibfähigkeiten seien nicht so gut wie bei GPT-4.5– was eurer Meinung nach auch der Fall sein sollte – und manche kreativen und technischen Aspekte wirkten schlechter.
Dieser Chat veranlasste den CEO von OpenAI, an einer Reddit-Fragerunde („Ask Me Anything“) teilzunehmen, um die Kritik zu entkräften. Er erklärte, ein Fehler im automatischen Modellwechsler habe dazu geführt, dass GPT-5 am ersten Tag nicht sein volles Potenzial ausschöpfen konnte. Er versprach mehr Transparenz bei zukünftigen Modellwechseln: „Ab heute sollte GPT-5 zunehmend intelligenter wirken.“ OpenAI sicherte außerdem zu, ältere Modelle wie GPT-40 für diejenigen wieder einzusetzen, die dies wünschten – ein Versuch, die lautstärksten Kritiker zu besänftigen.
Dass so schnell gehandelt werden musste, unterstreicht, wie viel auf dem Spiel stand. OpenAI befindet sich heute in einem erbitterten Wettlauf mit Konkurrenten wie Anthropic, Google DeepMind und sogar Elon Musks xAI. Angesichts dieser starken Konkurrenz kann ein kleiner Fehler schnell dazu führen, dass der Wettbewerber einen Schritt voraus ist.
Der Wettbewerb im KI-Rennen verschärft sich
Trotz dieser Unterschiede fiel die Resonanz auf GPT-5 eher verhalten aus, was es jedoch nicht daran hinderte, sich an die Spitze von LMArena, einer nutzergenerierten Rangliste für Trainingsmodelle, zu setzen. Obwohl es im heutigen Sinne nicht als programmierbar gelten würde, war es extrem schnell und ausdrucksstark und unterstützte große, komplexe Anfragen. Andere Benchmarks zeigten jedoch ein anderes, deutlich anspruchsvolleres Problemfeld. Grok 4 von Musks xAI erzielte bei ARC-AGI-2 (einer Reihe von Tests für fortgeschrittenes logisches Denken) so hohe Ergebnisse, dass es die Vormachtstellung von OpenAI ernsthaft infrage stellte.
Einige Branchenanalysten vermuten, dass es mindestens einen Tag dauern wird, bis die Auswirkungen von GPT-5 vollständig verstanden sind, ähnlich wie bei früheren Durchbrüchen des Unternehmens, beispielsweise GPT-3. GPT-5 und GPT-4 stießen auf erhebliche Kritik, bevor Verbesserungen durch Updates und andere Anwendungsfälle erzielt wurden. Das Modell hat das Potenzial, erfolgreich zu sein (oder zu scheitern), je nachdem, wie nützlich es für den alltäglichen Arbeitsablauf der Menschen ist. Weltweit gibt es fast 700 Millionen wöchentliche Nutzer von ChatGPT.
Wie Wharton-Professor Ethan Mollick es ausdrückt: „GPT-5 macht einfach Dinge, manchmal erstaunliche, manchmal rätselhafte, ganz von allein. Das macht es so faszinierend. Es ist immer noch eine technokratische, etwas unheimliche Herangehensweise, solche Bereiche des öffentlichen Gesundheitswesens als „interessant“ zu bezeichnen.“
Lesen Sie Krypto-News nicht nur, sondern verstehen Sie sie. Abonnieren Sie unseren Newsletter. Er ist kostenlos.
CRASH-KURS
- Mit welchen Kryptowährungen kann man Geld verdienen?
- Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
- Wenig bekannte Anlagestrategien, die Profis anwenden
- Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)















