Deepseek hat R1-0528 eingeführt, ein großes Upgrade des R1-Argumentationsmodells des chinesischen Start-ups, das im Januar veröffentlicht wurde. Das Upgrade traf nur einen Monat nach dem Qwen3 von Alibaba Group Holding den ursprünglichen Deepseek R1 in LiveBench, einem Online-Benchmark für Open-Source-Modelle für künstliche Intelligenz.
Deepseeks verbessertes R1-0528-Modell steht nun neben führenden KI-Modellen von OpenAI und Google in Leistung. Das Comeback zeigt, wie schnell Chinas große Technologieunternehmen und neuere Technologieunternehmen darauf drängen, ihre KI -Tools zu verbessern.
In seiner Aussage sagte Deepseek, R1-0528 zeigt bessere Argumentation und kreative Schreibfähigkeiten. Das Update bringt auch die Fähigkeit zurtron-Ger -Codierung. Am wichtigsten ist, dass das Unternehmen behauptet, dass das Modell jetzt 50% weniger „Halluzinationen“ produziert.
Deepseek erklärte, dass die Upgrades aus zusätzlichen Rechenleistung stammten, die während der Nachtrainingsphase investiert wurden, als Ingenieure ein Modell nach dem Haupttrainingsprozess in Feinabstimmen stimmen. Während der Nachbildungsphase wollen die Ingenieure die Effizienz des Modells erhöhen und seine Genauigkeit und Sicherheit verbessern.
R1-0528 liegt jetzt direkt hinter OpenAs O3 und O4-Mini
Auf LivecodeBench, das die KI-Modellleistung misst, R1-0528 jetzt hinter OpenAs O4-Mini- und O3-Modellen.
"Deepseeks neuestes Upgrade ist schärfer in Bezug auf Mathematik und Code, StronGer und sich mit Top-Tier-Modellen wie Gemini und O3 abschließen", sagte Adina Yakefu, AI-Forscher bei Hugging Face.
Sie fügte hinzu, dass die neue Version „wichtige Verbesserungen in Bezug auf Inferenz und Halluzinationsreduzierung“ zeigt und beweist, dass das Start-up nicht nur aufholt, sondern aktiv konkurriert.
Der schnelle Fortschritt erfolgte, nachdem Washington fortschrittliche Chips und andere technologische Exporte nach China eingeschränkt hatte. Doch chinesische Firmen verfeinern ihre Systeme weiter. Anfang dieses Monats beschrieben Baidu und Tencent , wie sie ihre Modelle trotz begrenzter Zugang zu modernen Halbleitern effizienter laufen lassen.
NVIDIA Chief Executive Jensen Huang kritisierte am Mittwoch die Exportkontrollen. "Die USA haben ihre Politik auf der Annahme, dass China keine AI -Chips machen kann", sagte er. "Diese Annahme war immer fraglich, und jetzt ist sie eindeutig falsch. Die Frage ist nicht, ob China KI haben wird. Es tut es bereits."
Deepseek erhöhte die Leistung des QWEN3 8B -Modells von Alibaba um 10% um 10%
Deepseek sagte auch, dass die in R1-0528 verwendeten Argumentationsschritte in das QWEN3 8B-Basismodell von Alibaba verwendet wurden. Dieser Prozess schuf ein neues, kleineres Modell, das laut dem Unternehmen die Leistung von QWEN3 um mehr als 10%übertraf. Gleichzeitig war das Modell 30 -mal kleiner.
„Wir glauben, dass die Gedankenkette von Deepseek-R1-0528 für die akademische Forschung zu Argumentationsmodellen und industriellen Arbeiten an kleinen Modellen von Bedeutung sein wird“, erklärte das Unternehmen.
Laut Reuters teilte ein Vertreter von Deepseek einer WeChat -Gruppe mit, dass die Änderung ein „geringfügiges Test -Upgrade“ sei, das bereits für öffentliche Tests geöffnet sei. Als Reaktion auf den Fiercer-Wettbewerb hat Google einige Gemini-Zugangsebenen abgezinst, während OpenAI das niedrigere O3-Mini-Modell einführte.
Academy : Kurz DeFi