Alibabas Qwen3 löst DeepSeeks R1 ab und führt nun die Open-Source-KI-Modelle an

- Die Qwen3-Familie von KI-Modellen von Alibaba hat DeepSeeks R1 übertroffen und ist zum weltweit besten Open-Source-Modell in Bereichen wie Sprachunterricht, Mathematik, Programmierung und Datenanalyse geworden.
- Qwen3 ist günstig in der Nutzung, da die Betriebskosten nur 0,55 US-Dollar pro 1 Million Token betragen.
- Die amerikanischen Chiphersteller Nvidia und Intel haben begonnen, Qwen3 zu unterstützen.
Alibabas neue KI-Modellfamilie Qwen3 hat DeepSeeks R1 überholt und ist nun das weltweit beste Open-Source-Modell. Berichten zufolge schnitt Qwen3 in Tests, die die Fähigkeiten von Open-Source-KI-Modellen in Bereichen wie Sprachunterricht, Mathematik, Programmierung und Datenanalyse messen, besser ab als R1.
Die Qwen3-Familie wurde letzte Woche von Alibabas Cloud-Computing-Sparte vorgestellt. Sie umfasst acht verbesserte Modelle mit 600 Millionen bis 235 Milliarden Parametern. Im maschinellen Lernen sind Parameter die Variablen eines KI-Systems während des Trainings.
Laut der LiveBench- Plattform, einer unabhängigendent zum Testen großer Sprachmodelle, war DeepSeeks R1 vor diesen neuen Tests seit seiner Veröffentlichung im Januar das beste Open-Source-KI-Modell der Welt. Doch das hat sich geändert.
Sowohl US-amerikanische als auch chinesische Unternehmen beeilen sich, Qwen 3 einzuführen
Der Aufstieg von Qwen3 in den LiveBench-Rankings verdeutlicht das rasante Wachstum von KI in China. Die chinesische Technologiebranche hat dank Open-Source-Tools ein enormes Wachstum erlebt. Der Open-Source-Code von Alibaba ermöglicht es anderen Softwareentwicklern, das Design zu teilen, defekte Links zu reparieren oder das Programm leistungsfähiger zu machen.
Die Gesamtergebnisse von LiveBench zeigten jedoch, dass Qwen3 nicht so gut abschnitt wie OpenAIs o3, Googles Gemini Pro 2.5 und Anthropics Claude 3.7 – die weltweit besten proprietären KI-Modelle. Laut LiveBench war o3-mini high, das beliebteste KI-Modell von OpenAI, insgesamt das beste weltweit. Microsoft unterstützt OpenAI.
Für jede Million Token kostet der Betrieb von o3 10 US-Dollar. Qwen3 hingegen ist günstiger, da der Betrieb nur 0,55 US-Dollar pro Million Token kostet. Aufgrund der geringeren Kosten und der besseren Performance von Qwen3 gaben viele Unternehmen an, Alibabas neuestes KI-Modell nach dessen Veröffentlichung zu unterstützen.
Huawei Technologies, Moore Threads, Cambricon Technologies und Hygon Information Technology sind allesamt Chiphersteller, die angekündigt haben, Qwen3 zu unterstützen.
Cambricon gab am vergangenen Dienstag bekannt, Qwen3 erfolgreich für die schnelle Ausführung auf seinen Grafikprozessoren optimiert zu haben. Dies geschah, da KI-Entwickler auf den Philippinen Chips aus chinesischer Produktion bevorzugten.
Qwen3 wird auch in den Cloud-Computing-Diensten von Hyperbolic und Fireworks.ai, zwei Anbietern von KI-Infrastruktur, eingesetzt. Die amerikanischen Chiphersteller Nvidia und Intel unterstützen Qwen3 mittlerweile ebenfalls.
Viele große Rechenzentren in China, darunter jene in Peking, Shanghai, Hangzhou sowie in den Provinzen Hubei, Jilin und Nordwest-Shaanxi, haben angekündigt, die KI-Modelle der dritten Generation von Alibabas Qwen-Plattform einzusetzen. Auch das Supercomputing-Netzwerk Chinas nutzt Qwen3. Dieses Netzwerk verbindet über 20 Rechenzentren in 20 Städten in 14 Provinzen.
Der CEO von Anthropic sagt, DeepSeek sei „etwas überbewertet“ worden
Auf einer Wirtschaftsveranstaltung erklärte ein Mitbegründer von Anthropic, dem Unternehmen hinter den Claude-KI-Modellen, dass DeepSeek immer noch „sechs bis acht Monate hinter den führenden US-Unternehmen zurückliegt“. Er fügte hinzu, dass der jüngste Hype um das chinesische Start-up „vielleicht etwas übertrieben“ sei
DeepSeek erregte Ende Dezember 2024 und Anfang Januar 2025 weltweites Aufsehen durch die Veröffentlichung zweier fortschrittlicher Open-Source-KI-Modelle, V3 und R1. Diese Modelle wurden mit einem Bruchteil der Kosten und Rechenleistung entwickelt, die große Technologieunternehmen normalerweise für LLM-Projekte benötigen.
Es ist unklar, wann DeepSeek die nächste Generation seiner Modelle veröffentlichen wird. Das Unternehmen mit Sitz in Hangzhou brachte Ende April. Dabei handelte es sich um ein Update seines Spezialmodells für mathematische Beweise. Über den Fortschritt seines lang erwarteten R2-Modells für logisches Schließen hat sich DeepSeek jedoch noch nicht geäußert.
Überlassen Sie das Beste immer noch der Bank? Sehen Sie sich unser kostenloses Video zum Thema „ Ihre eigene Bank sein“.
Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtrondentdentdentdentdentdentdentdent oder einen qualifizierten Fachmann zu konsultieren
CRASH-KURS
- Mit welchen Kryptowährungen kann man Geld verdienen?
- Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
- Wenig bekannte Anlagestrategien, die Profis anwenden
- Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)















