Ein chinesisches Unternehmen für künstliche Intelligenz hat seinen Haupt-Chatbot um Bild- und Videoerkennung erweitert.
Gleichzeitig zeigten die lokalen Chiphersteller, dass sie mittlerweile in der Lage sind, die schnelle Markteinführungsunterstützung zu bieten, die früher eine Stärke der USA war.
DeepSeek, ein Unternehmen aus Hangzhou, hat still und leise eine neue Funktion namens „Bilderkennungsmodus“ in seine Chat-Plattform integriert. Dieser neue Modus ergänzt die beiden anderen Modi „Experte“ und „Blitz“, die das Unternehmen Anfang des Monats eingeführt hat
Die neue Funktion ermöglicht es dem Chatbot, nicht nur Text, sondern auch Fotos und Videos zu verstehen.
Damit steht es im Einklang mit anderen großen KI-Chatbots, die schon seit einiger Zeit ähnliche Fähigkeiten anbieten.
Chen Xiaokang, Leiter des multimodalen Teams von DeepSeek, sagte, das Tool sei zunächst mit einer kleinen Gruppe von Nutzern sowohl auf der Website als auch in der mobilen App getestet worden.
Chen Deli, eine leitende Forscherin des Unternehmens, feierte die Markteinführung mit einem kurzen Beitrag , der sich auf das Firmenlogo bezog: „Der kleine Wal kann jetzt sehen.“
Die Bild- und Videofunktion wurde nur wenige Tage, nachdem DeepSeek eine Vorschau seines neuesten Flaggschiffmodells DeepSeek-V4 veröffentlicht und die Modellgewichte für jedermann zum Download und zur Verwendung freigegeben hatte, eingeführt.
V4 besteht nicht aus einem, sondern aus zwei Modellen. Das erste, DeepSeek-V4-Pro, verfügt über 1,6 Billionen Parameter und ist für anspruchsvolle Aufgaben konzipiert, die komplexe Schlussfolgerungen und mehrstufige automatisierte Arbeitsabläufe erfordern.
Das zweite Modell, DeepSeek-V4-Flash, ist für die kostengünstige Verarbeitung einer großen Anzahl von Anfragen ausgelegt. Beide Modelle unterstützen ein Kontextfenster von einer Million Tokens.
Sie verwenden außerdem ein hybrides Aufmerksamkeitsdesign, das laut Unternehmen den Rechenaufwand und den Speicherbedarf während der Inferenz reduziert.
Chinesische Chiphersteller erreichen einen neuen Meilenstein
Was die Aufmerksamkeit vieler Branchenbeobachter auf sich zog, war nicht nur das Modell selbst, sondern das, was am Tag seiner Markteinführung geschah.
Vier chinesische Chiphersteller, Huawei Ascend, Cambricon, Hygon Information und Moore Threads, bestätigten übereinstimmend, dass ihre Hardware vom ersten Tag an, an dem V4 auf den Markt kam, einwandfrei funktionierte.
Diese Art von Unterstützung am selben Tag, bei der ein neues Modell direkt zum Marktstart reibungslos auf Chips von Drittanbietern läuft, anstatt erst Wochen oder Monate später, war außerhalb des eigenen Nvidia-Ökosystems bisher nahezu unmöglich.
Die Ascend-Chips von Huawei, darunter die Modelle A2, A3 und 950, unterstützen sowohl V4-Pro als auch V4-Flash.
Das Unternehmen erklärte, sein Ascend 950-Chip nutze verschmolzene Rechenprozesse und parallele Verarbeitungsströme, um die Inferenz zu beschleunigen.
Cambricon schloss seine Anpassung unter Verwendung des Open-Source-Inferenzframeworks vLLM ab und teilte seinen Code auf GitHub.
Hygon gab an, eine tiefgreifende Modelloptimierung an seiner DCU-Plattform durchgeführt zu haben, um einen reibungslosen Übergang von der Modellfreigabe bis zur tatsächlichen Nutzung zu gewährleisten.
Moore Threads arbeitete mit der Beijing Academy of Artificial Intelligence zusammen, um V4 auf ihrer MTT S5000-Karte unter Verwendung des FlagOS-Software-Stacks auszuführen.
Branchenbeobachter sagen, dieser koordinierte Start stelle einen echten Wandel dar.
Jahrelang dauerte es Monate, bis Chips von Herstellern außerhalb des Nvidia-Ökosystems ein neues, größeres Modell unterstützten. Dass nun acht verschiedene inländische Chipsätze vom ersten Tag an funktionieren, ist ein bedeutender Meilenstein.
Das Gesamtbild: Kosten und Unabhängigkeit für Deepseek
Beobachter glauben, dass die größere Bedeutung dieses Starts darin besteht, dass DeepSeek gezeigt hat, dass es in der Lage ist, KI auf hohem Niveau zu liefern, ohne auf westliche Hardware angewiesen zu sein.
Indem das Unternehmen seine Modelle so gestaltet, dass sie gleichzeitig auf mehreren chinesischen Chips nativ laufen, verringert es das Risiko von Exportbeschränkungen, die chinesische Unternehmen bisher vom Zugang zu den leistungsstärksten amerikanischen Prozessoren abgehalten haben.
Auch die Kosten spielen eine wichtige Rolle. DeepSeek hat intensiv daran gearbeitet, die Kosten für den Betrieb seiner Modelle niedrig zu halten. Dies erleichtert es Unternehmen, automatisierte Systeme zu entwickeln, ohne mit sehr hohen Rechenkosten konfrontiert zu werden.
Auf diese Weise geht es bei den Upgrades und der Markteinführung von Deepseek nicht primär um einen einzelnen technischen Durchbruch. Vielmehr geht es um das Zusammenwirken einer gesamten Lieferkette.
Aus dieser Veröffentlichung geht hervor, dass sich die Frage nach der Führungsrolle im Bereich KI weg von der Frage, wer das intelligenteste Modell entwickelt, hin zu der Frage verschiebt, wer das gesamte System langfristig kostengünstig unddentbetreiben kann.

