Cerebras fordert Nvidia heraus, indem es einen KI-Inferenzdienst auf den Markt bringt

- Cerebras, ein innovativer Chiphersteller, hat seinen eigenen KI-Inferenzdienst eingeführt.
- Das Unternehmen wird seine neuesten Wafer Scale Engine-Chips einsetzen, die schneller sind als herkömmliche GPUs.
- Crebras bietet den Service zu einem deutlich günstigeren Preis von 10 Cent pro Million Token an.
Cerebras Systems hat am Dienstag eine KI-Inferenzlösung für Entwickler angekündigt. Laut Unternehmensangaben handelt es sich um eine deutlich schnellere Inferenzlösung, die 20-mal schneller ist als die Angebote von Nvidia.
Cerebras wird Zugriff auf seine leistungsstärkeren Chips für KI-Anwendungen ermöglichen, die laut Unternehmen auch günstiger als Nvidia-GPUs sind. Die branchenüblichen Nvidia-GPUs werden häufig über Cloud-Service-Anbieter genutzt, um große Sprachmodelle wie ChatGPT auszuführen. Für viele kleine Unternehmen ist der Zugriff darauf in der Regel schwierig und teuer.
Cerebras behauptet, seine neuen Chips könnten eine Leistung erbringen, die über die von GPUs hinausgeht
KI-Inferenz ist der Prozess, bei dem ein bereits trainiertes KI-Modell ausgeführt wird, um Ergebnisse zu erzielen, beispielsweise Antworten von Chatbots oder die Lösung verschiedener Aufgaben. Inferenzdienste bilden das Rückgrat heutiger KI-Anwendungen, da sie für den täglichen Betrieb und die Unterstützung der Nutzer unerlässlich sind.
Cerebras gab bekannt, dass Inferenz das am schnellsten wachsende Segment der KI-Branche ist und 40 % aller KI-bezogenen Workloads im Cloud Computing ausmacht. Laut Cerebras-CEO Andrew Feldman bieten die übergroßen Chips des Unternehmens eine höhere Leistung als GPUs. GPUs könnten dieses Leistungsniveau nicht erreichen, so Feldman in einem Interview mit Reuters.
Er fügte hinzu:
„Wir bieten höchste Genauigkeit und den niedrigsten Preis.“ Quelle: Reuters.
Der CEO erklärte, die bestehenden KI-Inferenzdienste seien nicht für alle Kunden zufriedenstellend. Gegenüber einer anderen Gruppe von Journalisten in San Francisco sagte er, das Unternehmen verzeichne „vielfältiges Interesse“ an schnelleren und kostengünstigeren Lösungen.
Bislang dominierte Nvidia den Markt für KI-Computing mit seinen erstklassigen Chips und der Programmierumgebung Compute Unified Device Architecture (CUDA). Dies half Nvidia, Entwickler durch ein breites Spektrum an Tools an sein Ökosystem zu binden.
Cerbras-Chips verfügen über 7000-mal mehr Speicher als Nvidia H100-GPUs
Cerebras bezeichnete seinen Hochgeschwindigkeits-Inferenzdienst als Wendepunkt für die KI-Branche. Die neuen Chips des Unternehmens, die so groß wie Essteller sind, werden Wafer Scale Engines genannt. Sie können 1000 Token pro Sekunde verarbeiten, was laut Unternehmen mit der Einführung von Breitbandinternet vergleichbar ist.
Laut dem Unternehmen liefern die neuen Chips je nach KI-Modell unterschiedliche Leistungsmengen. Beim Llama 3.1 8B können die neuen Chips bis zu 1800 Token pro Sekunde verarbeiten, beim Llama 3.1 70B hingegen 450 Token pro Sekunde.
Cerebras bietet Inferenzdienste für 10 Cent pro eine Million Token an, was günstiger ist als GPU-basierte Lösungen. Branchenüblicherweise wird bei alternativen Ansätzen die Genauigkeit zugunsten der Leistung geopfert, während die neuen Chips von Cerebras laut Unternehmensangaben die Genauigkeit beibehalten können.
Cerebras kündigte an, KI-Inferenzprodukte in verschiedenen Ausführungen anzubieten. Das Unternehmen plant die Einführung eines Inferenzdienstes über seine Cloud sowie eines Entwicklerschlüssels. Die neuen Chips werden außerdem an Rechenzentrumsbetreiber und Anwender, die eigene Systeme betreiben möchten, verkauft.
Die neuen Wafer Scale Engine-Chips verfügen über eigene integrierte Kühl- und Stromversorgungsmodule und sind Bestandteil des Cerebras-Rechenzentrumssystems CS-3. Verschiedenen Berichtenbildet das Cerebras CS-3-System das Rückgrat des Inferenzdienstes des Unternehmens.
Das System verfügt über eine 7000-mal höhere Speicherkapazität als Nvidia H100-GPUs. Damit wird auch das grundlegende Problem der Speicherbandbreite gelöst, an dem viele Chiphersteller arbeiten.
Cerbras arbeitet außerdem daran, ein börsennotiertes Unternehmen zu werden. Zu diesem Zweck hat das Unternehmen diesen Monat einendentProspekt bei der US-Börsenaufsichtsbehörde (SEC) eingereicht.
Die klügsten Köpfe der Krypto-Szene lesen bereits unseren Newsletter. Möchten Sie auch dabei sein? Dann schließen Sie sich ihnen an.
Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtrondentdentdentdentdentdentdentdent oder einen qualifizierten Fachmann zu konsultieren
CRASH-KURS
- Mit welchen Kryptowährungen kann man Geld verdienen?
- Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
- Wenig bekannte Anlagestrategien, die Profis anwenden
- Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)















