DeepSeek hat R1-0528 veröffentlicht, ein umfassendes Upgrade seines im Januar erschienenen R1-Logikmodells. Das Upgrade erfolgte nur einen Monat, nachdem Qwen3 von Alibaba Group Holding das ursprüngliche DeepSeek R1 im LiveBench, einem Online-Benchmark für Open-Source-KI-Modelle, übertroffen hatte.
DeepSeeks verbessertes Modell R1-0528 kann sich leistungsmäßig nun mit führenden KI-Modellen von OpenAI und Google messen. Dieses Comeback zeigt, wie schnell Chinas große und junge Technologieunternehmen ihre KI-Tools verbessern.
In einer Stellungnahme erklärte DeepSeek, dass R1-0528 ein besseres logisches Denkvermögen und kreatives Schreiben aufweise. Das Update bringe zudemtronProgrammierfähigkeiten mit sich. Am wichtigsten sei jedoch, dass das Modell laut Unternehmen nun 50 % weniger „Halluzinationen“ produziere
DeepSeek erklärte, die Verbesserungen resultierten aus zusätzlicher Rechenleistung, die in der Nachtrainingsphase investiert wurde. In dieser Phase optimieren die Ingenieure das Modell nach dem Haupttrainingsprozess. Ziel der Nachtrainingsphase ist es, die Effizienz, Genauigkeit und Sicherheit des Modells zu steigern.
R1-0528 liegt nun direkt hinter OpenAIs o3 und o4-mini
Auf LiveCodeBench, einem Tool zur Messung der Leistungsfähigkeit von KI-Modellen, R1-0528 nun direkt hinter den OpenAI-Modellen o4-mini und o3.
„DeepSeeks neuestes Upgrade ist schärfer im logischen Denken,tronin Mathematik und Code und nähert sich Spitzenmodellen wie Gemini und O3 an“, sagte Adina Yakefu, KI-Forscherin bei Hugging Face.
Sie fügte hinzu, dass die neue Version „deutliche Verbesserungen bei der Schlussfolgerung und der Reduzierung von Halluzinationen“ aufweise und beweise, dass das Start-up nicht nur aufhole, sondern aktiv konkurriere.
Die rasanten Fortschritte erfolgten, nachdem Washington die Exporte von Hochleistungschips und anderen Technologien nach China eingeschränkt hatte. Dennoch arbeiten chinesische Unternehmen weiterhin an der Optimierung ihrer Systeme. Anfang des Monats erläuterten Baidu und Tencent , wie sie ihre Geschäftsmodelle trotz des eingeschränkten Zugangs zu modernsten Halbleitern effizienter gestalten.
Nvidia-Chef Jensen Huang kritisierte am Mittwoch die Exportkontrollen. „Die USA haben ihre Politik auf der Annahme aufgebaut, dass China keine KI-Chips herstellen kann“, sagte er. „Diese Annahme war schon immer fragwürdig und ist nun eindeutig falsch. Die Frage ist nicht, ob China über KI verfügen wird. Das Land verfügt bereits darüber.“
DeepSeek steigerte die Leistung des Alibaba-Modells Qwen3 8B um 10 %
DeepSeek gab außerdem an, die in R1-0528 verwendeten Analyseschritte in Qwen3 8B von Alibaba integriert zu haben. Dadurch entstand ein neues, kleineres Modell, das die Leistung von Qwen3 um mehr als 10 % übertrifft. Gleichzeitig ist das Modell 30-mal kleiner.
„Wir glauben, dass die Gedankenkette von DeepSeek-R1-0528 für die akademische Forschung an Schlussfolgerungsmodellen und für die industrielle Arbeit an kleinen Modellen von erheblicher Bedeutung sein wird“, erklärte das Unternehmen.
Laut Reuters erklärte ein DeepSeek-Vertreter in einer WeChat-Gruppe, die Änderung handele sich um ein „kleines Test-Upgrade“, das bereits öffentlich getestet werde. Angesichts des verschärften Wettbewerbs hat Google einige Gemini-Zugangsstufen preislich gesenkt, während OpenAI das kostengünstigere Modell o3 Mini eingeführt hat.
Foto von 