Das chinesische Unternehmen DeepSeek stellt ein KI-Modell der nächsten Generation vor, das mit GPT-5 konkurrieren soll. Aber ist es gut genug?

- DeepSeek hat am Montag sein neues Modell V3.2-Exp vorgestellt, das sich auf Geschwindigkeit, Kostenreduzierung und die Verarbeitung großer Datenmengen konzentriert.
- Das Modell führt DeepSeek Sparse Attention ein, das irrelevante Daten überspringt, um die Effizienz zu steigern und die Kosten zu halbieren.
- Experten warnen davor, dass mangelnde Aufmerksamkeit trotz ihrer Vorteile wichtige Informationen ausblenden und die Zuverlässigkeit beeinträchtigen könnte.
Das chinesische Technologie-Wunderkind DeepSeek hat ein neues experimentelles Modell, V3.2-Exp, vorgestellt, um die amerikanische Vormachtstellung im Bereich der künstlichen Intelligenz herauszufordern. Die Veröffentlichung erfolgte am Montag und wurde zuerst durch einen Beitrag auf Hugging Face, einem beliebten KI-Forum, bekannt gegeben.
DeepSeek behauptet, dass diese neueste Version auf dem aktuellen Modell V3.1-Terminus aufbaut, jedoch mit einem ebensotronFokus auf Geschwindigkeit, Kosten und Speicherverwaltung.
Laut Adina Yakefu, der Leiterin der chinesischen Community von Hugging Face, verfügt das Modell über eine Technologie namens DeepSeek Sparse Attention (DSA), die es der KI ermöglicht, „lange Dokumente und Konversationen besser zu verarbeiten“ und gleichzeitig die Betriebskosten zu halbieren.
Sie Erinnern? Vor etwa einem Jahr sorgte DeepSeek mit der Veröffentlichung seines ersten Modells, R1, für Aufsehen und wirbelte die Branche durcheinander. Dieses Modell bewies, dass es möglich ist, ein großes Sprachmodell mit weniger Chips und deutlich geringerer Rechenleistung zu trainieren. Niemand hatte erwartet, dass ein chinesisches Team dies unter diesen Bedingungen schaffen würde. Mit V3.2-Exp bleibt das Ziel unverändert: weniger Hardware, mehr Leistung.
Fügt DeepSeek Sparse Attention hinzu und reduziert die KI-Betriebskosten
DSA ist das zentrale Merkmal dieses Modells. Es verändert die Art und Weise, wie die KI die relevanten Informationen auswählt. Anstatt alles zu scannen, trainiert DeepSeek das Modell darauf, sich nur auf das zu konzentrieren, was für die jeweilige Aufgabe nützlich erscheint. Adina erklärte , dass dies einen zweifachen Vorteil bietet: „Effizienz“ und „Kostenreduzierung“.
Durch das Überspringen irrelevanter Daten arbeitet das Modell schneller und benötigt weniger Energie. Sie erklärte, das Modell sei mit Blick auf die Zusammenarbeit mit Open-Source-Software entwickelt worden.
Nick Patience, Leiter der KI-Forschung bei der Futurum Group, erklärte gegenüber CNBC, das Modell habe das Potenzial, leistungsstarke KI-Tools auch Entwicklern zugänglich zu machen, die sich teurere Modelle nicht leisten können. „Es sollte das Modell schneller und kostengünstiger machen, ohne dass die Leistung merklich sinkt“, so Patience. Das bedeute aber nicht, dass es keine Risiken gebe.
ähnlich DeepSeek wie Fluggesellschaften Flugrouten auswählen. Es gibt Hunderte von Möglichkeiten, von einem Ort zum anderen zu gelangen, aber nur wenige sind sinnvoll. Das Modell filtert die irrelevanten Informationen heraus und konzentriert sich auf das Wesentliche – oder zumindest auf das, was es hält .
Doch das birgt Risiken. Ekaterina Almasque, Mitgründerin von BlankPage Capital, erklärte es so: „Man streicht im Grunde alles, was man für unwichtig hält.“ Das Problem sei jedoch, so Almasque, dass es keine Garantie dafür gebe, dass das Modell die richtigen Dinge aussortiere.
Ekaterina, die Unternehmen wie Dataiku, Darktracund Graphcore unterstützt hat, warnte davor, dass Kompromisse bei der Datenqualität später Probleme verursachen könnten. „Diese [Sparse Attention Models] haben viele Nuancen verloren“, sagte sie. „Und die eigentliche Frage ist: Verfügten sie über den richtigen Mechanismus, um unwichtige Daten auszuschließen, oder gibt es einen Mechanismus, der wirklich wichtige Daten ausschließt, sodass das Ergebnis deutlich weniger relevant ist?“
Verbindet sich mit chinesischen Chips und veröffentlicht offenen Code
Trotz dieser Bedenken versichert DeepSeek, dass V3.2-Exp genauso leistungsfähig ist wie V3.1-Terminus. Das Modell läuft zudem direkt auf chinesischen Chips wie Ascend und Cambricon, ohne dass zusätzliche Konfigurationen erforderlich sind. Dies ist ein Schlüsselfaktor für Chinas Bestrebungen, KI auf heimischer Hardware zu entwickeln und die Abhängigkeit von ausländischer Technologie zu verringern. „DeepSeek funktioniert sofort nach dem Auspacken mit diesen Chips“, so Adina.
Das Unternehmen hat außerdem den vollständigen Quellcode und die zugehörigen Tools des Modells öffentlich zugänglich gemacht. Das bedeutet, dass jeder V3.2-Exp herunterladen, ausführen, modifizieren oder darauf aufbauen kann. Dieser Schritt entspricht DeepSeeks Open-Source-Strategie, wirft aber ein weiteres Problem auf: Patente. Da das Modell offen zugänglich ist und die Kernidee – spärliche Aufmerksamkeit – bereits seit 2015 existiert, kann DeepSeek sie nicht rechtlich schützen lassen.
„Der Ansatz ist nicht sonderlich neu“, sagte Ekaterina. Für sie ist der einzig verteidigungsfähige Aspekt der Technologie, wie DeepSeek auswählt, was beibehalten und was ignoriert wird.
Hier liegt der eigentliche Wettbewerb. Es geht nicht nur darum, intelligentere Modelle zu entwickeln, sondern sie auch schneller, kostengünstiger und effizienter zu gestalten – ohne dabei die Ergebnisse zu beeinträchtigen. Selbst DeepSeek bezeichnete diese Version als „Zwischenschritt hin zu unserer Architektur der nächsten Generation“, was darauf hindeutet, dass sie bereits an etwas Größerem arbeiten.
Nick erklärte, das Modell zeige, dass Effizienz heute genauso wichtig sei wie reine Rechenleistung. Adina ist überzeugt, dass das Unternehmen langfristig plant. „DeepSeek setzt auf langfristige Strategien, um die Community langfristig an den Fortschritt zu beteiligen“, sagte sie. „Die Menschen werden sich immer für das entscheiden, was günstig, zuverlässig und effektiv ist.“
Wenn Sie das hier lesen, sind Sie schon einen Schritt voraus. Bleiben Sie mit unserem Newsletter auf dem Laufenden.
CRASH-KURS
- Mit welchen Kryptowährungen kann man Geld verdienen?
- Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
- Wenig bekannte Anlagestrategien, die Profis anwenden
- Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)















