NEUESTE NACHRICHTEN

Arkham bringt mit neuer Analysesuite On-Chain-Intelligenz in die Prognosemärkte

vor 9 Minuten Nachrichten
Stablecoins entwickeln sich von Krypto-Handelsinstrumenten zu einer globalen Zahlungsinfrastruktur

vor 1 Stunde Nachrichten
Meta fordert Kanada auf, Gesetzesentwurf C-22 hinsichtlich Verschlüsselungs- und Überwachungsbedenken zu ändern

vor 2 Stunden Nachrichten
Bitcoin Bullen verstärken ihre Angebotskontrolle, während die Reserven der Börsen auf ein Zweijahrestief fallen

vor 3 Stunden Nachrichten

FÜR SIE AUSGEWÄHLT

WÖCHENTLICH

BLEIBEN SIE AN DER SPITZE

Die besten Krypto-Einblicke direkt in Ihren Posteingang.

Das chinesische Unternehmen DeepSeek stellt ein KI-Modell der nächsten Generation vor, das mit GPT-5 konkurrieren soll. Aber ist es gut genug?

Von

Jai Hamid

3 Minuten Lesezeit , 30. September 2025

Das chinesische Unternehmen DeepSeek stellt ein KI-Modell der nächsten Generation vor, das mit GPT-5 konkurrieren soll. Aber ist es gut genug?

DeepSeek hat am Montag sein neues Modell V3.2-Exp vorgestellt, das sich auf Geschwindigkeit, Kostenreduzierung und die Verarbeitung großer Datenmengen konzentriert.
Das Modell führt DeepSeek Sparse Attention ein, das irrelevante Daten überspringt, um die Effizienz zu steigern und die Kosten zu halbieren.
Experten warnen davor, dass mangelnde Aufmerksamkeit trotz ihrer Vorteile wichtige Informationen ausblenden und die Zuverlässigkeit beeinträchtigen könnte.

Das chinesische Technologie-Wunderkind DeepSeek hat ein neues experimentelles Modell, V3.2-Exp, vorgestellt, um die amerikanische Vormachtstellung im Bereich der künstlichen Intelligenz herauszufordern. Die Veröffentlichung erfolgte am Montag und wurde zuerst durch einen Beitrag auf Hugging Face, einem beliebten KI-Forum, bekannt gegeben.

DeepSeek behauptet, dass diese neueste Version auf dem aktuellen Modell V3.1-Terminus aufbaut, jedoch mit einem ebensotronFokus auf Geschwindigkeit, Kosten und Speicherverwaltung.

Laut Adina Yakefu, der Leiterin der chinesischen Community von Hugging Face, verfügt das Modell über eine Technologie namens DeepSeek Sparse Attention (DSA), die es der KI ermöglicht, „lange Dokumente und Konversationen besser zu verarbeiten“ und gleichzeitig die Betriebskosten zu halbieren.

Sie Erinnern? Vor etwa einem Jahr sorgte DeepSeek mit der Veröffentlichung seines ersten Modells, R1, für Aufsehen und wirbelte die Branche durcheinander. Dieses Modell bewies, dass es möglich ist, ein großes Sprachmodell mit weniger Chips und deutlich geringerer Rechenleistung zu trainieren. Niemand hatte erwartet, dass ein chinesisches Team dies unter diesen Bedingungen schaffen würde. Mit V3.2-Exp bleibt das Ziel unverändert: weniger Hardware, mehr Leistung.

Fügt DeepSeek Sparse Attention hinzu und reduziert die KI-Betriebskosten

DSA ist das zentrale Merkmal dieses Modells. Es verändert die Art und Weise, wie die KI die relevanten Informationen auswählt. Anstatt alles zu scannen, trainiert DeepSeek das Modell darauf, sich nur auf das zu konzentrieren, was für die jeweilige Aufgabe nützlich erscheint. Adina erklärte , dass dies einen zweifachen Vorteil bietet: „Effizienz“ und „Kostenreduzierung“.

Durch das Überspringen irrelevanter Daten arbeitet das Modell schneller und benötigt weniger Energie. Sie erklärte, das Modell sei mit Blick auf die Zusammenarbeit mit Open-Source-Software entwickelt worden.

Nick Patience, Leiter der KI-Forschung bei der Futurum Group, erklärte gegenüber CNBC, das Modell habe das Potenzial, leistungsstarke KI-Tools auch Entwicklern zugänglich zu machen, die sich teurere Modelle nicht leisten können. „Es sollte das Modell schneller und kostengünstiger machen, ohne dass die Leistung merklich sinkt“, so Patience. Das bedeute aber nicht, dass es keine Risiken gebe.

ähnlich DeepSeek wie Fluggesellschaften Flugrouten auswählen. Es gibt Hunderte von Möglichkeiten, von einem Ort zum anderen zu gelangen, aber nur wenige sind sinnvoll. Das Modell filtert die irrelevanten Informationen heraus und konzentriert sich auf das Wesentliche – oder zumindest auf das, was es hält .

Doch das birgt Risiken. Ekaterina Almasque, Mitgründerin von BlankPage Capital, erklärte es so: „Man streicht im Grunde alles, was man für unwichtig hält.“ Das Problem sei jedoch, so Almasque, dass es keine Garantie dafür gebe, dass das Modell die richtigen Dinge aussortiere.

Ekaterina, die Unternehmen wie Dataiku, Darktracund Graphcore unterstützt hat, warnte davor, dass Kompromisse bei der Datenqualität später Probleme verursachen könnten. „Diese [Sparse Attention Models] haben viele Nuancen verloren“, sagte sie. „Und die eigentliche Frage ist: Verfügten sie über den richtigen Mechanismus, um unwichtige Daten auszuschließen, oder gibt es einen Mechanismus, der wirklich wichtige Daten ausschließt, sodass das Ergebnis deutlich weniger relevant ist?“

Verbindet sich mit chinesischen Chips und veröffentlicht offenen Code

Trotz dieser Bedenken versichert DeepSeek, dass V3.2-Exp genauso leistungsfähig ist wie V3.1-Terminus. Das Modell läuft zudem direkt auf chinesischen Chips wie Ascend und Cambricon, ohne dass zusätzliche Konfigurationen erforderlich sind. Dies ist ein Schlüsselfaktor für Chinas Bestrebungen, KI auf heimischer Hardware zu entwickeln und die Abhängigkeit von ausländischer Technologie zu verringern. „DeepSeek funktioniert sofort nach dem Auspacken mit diesen Chips“, so Adina.

Das Unternehmen hat außerdem den vollständigen Quellcode und die zugehörigen Tools des Modells öffentlich zugänglich gemacht. Das bedeutet, dass jeder V3.2-Exp herunterladen, ausführen, modifizieren oder darauf aufbauen kann. Dieser Schritt entspricht DeepSeeks Open-Source-Strategie, wirft aber ein weiteres Problem auf: Patente. Da das Modell offen zugänglich ist und die Kernidee – spärliche Aufmerksamkeit – bereits seit 2015 existiert, kann DeepSeek sie nicht rechtlich schützen lassen.

„Der Ansatz ist nicht sonderlich neu“, sagte Ekaterina. Für sie ist der einzig verteidigungsfähige Aspekt der Technologie, wie DeepSeek auswählt, was beibehalten und was ignoriert wird.

Hier liegt der eigentliche Wettbewerb. Es geht nicht nur darum, intelligentere Modelle zu entwickeln, sondern sie auch schneller, kostengünstiger und effizienter zu gestalten – ohne dabei die Ergebnisse zu beeinträchtigen. Selbst DeepSeek bezeichnete diese Version als „Zwischenschritt hin zu unserer Architektur der nächsten Generation“, was darauf hindeutet, dass sie bereits an etwas Größerem arbeiten.

Nick erklärte, das Modell zeige, dass Effizienz heute genauso wichtig sei wie reine Rechenleistung. Adina ist überzeugt, dass das Unternehmen langfristig plant. „DeepSeek setzt auf langfristige Strategien, um die Community langfristig an den Fortschritt zu beteiligen“, sagte sie. „Die Menschen werden sich immer für das entscheiden, was günstig, zuverlässig und effektiv ist.“

Wenn Sie das hier lesen, sind Sie schon einen Schritt voraus. Bleiben Sie mit unserem Newsletter auf dem Laufenden.

Cambricon DeepSeek Huawei

Diesen Artikel teilen

Jai Hamid

Jai Hamid ist eine professionelle Autorin mit sechs Jahren Berufserfahrung bei verschiedenen Blockchain-Medienunternehmen wie AMB Crypto, Coin Edition und CryptoTale. Sie hat einen Bachelor-Abschluss in Gesundheitsmanagement und war bereits in einem der führenden afrikanischen Fernsehsender zu sehen, wo sie Einblicke in die Welt der Kryptowährungen gab.

INHALTSVERZEICHNIS

1. Fügt DeepSeek Sparse Attention hinzu und reduziert die KI-Betriebskosten

2. Verbindet sich mit chinesischen Chips und veröffentlicht offenen Code

Diesen Artikel teilen

MEHR … NACHRICHTEN

ALLE ANZEIGEN

Was ist Base? Das von Coinbase ins Leben gerufene Ethereum Layer-2-Netzwerk

21. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Dogecoin vs. Bitcoin: Wichtigste technische Unterschiede

20. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist TVL (Total Value Locked) bei Kryptowährungen?

14. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Wie liest man ein Krypto-Whitepaper?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Ripple vs. XRP vs. XRP Ledger: Was ist der Unterschied?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist eine Multisig-Wallet im Kryptobereich?

10. Oktober 2025 Krypto lernen: Leitfaden für Anfänger

DEEP CRYPTO
CRASH-KURS

Mit welchen Kryptowährungen kann man Geld verdienen?
Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
Wenig bekannte Anlagestrategien, die Profis anwenden
Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)

Das chinesische Unternehmen DeepSeek stellt ein KI-Modell der nächsten Generation vor, das mit GPT-5 konkurrieren soll. Aber ist es gut genug?

Fügt DeepSeek Sparse Attention hinzu und reduziert die KI-Betriebskosten

Verbindet sich mit chinesischen Chips und veröffentlicht offenen Code

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.
Jeden Tag.

Das chinesische Unternehmen DeepSeek stellt ein KI-Modell der nächsten Generation vor, das mit GPT-5 konkurrieren soll. Aber ist es gut genug?

Fügt DeepSeek Sparse Attention hinzu und reduziert die KI-Betriebskosten

Verbindet sich mit chinesischen Chips und veröffentlicht offenen Code

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.Jeden Tag.

Ein prägnanter Brief.
Jeden Tag.