Die chinesischen Technologiegiganten Alibaba Group Holding und Tencent Holdings haben das neueste KI-Modell von Meta Platforms, Llama 3.1, schnell in ihre Cloud-Dienste integriert. Die Einführung von Llama 3.1 hat große Aufmerksamkeit erregt und zu einer schnellen Einführung durch diese führenden Unternehmen geführt.
Lesen Sie auch: Elon Musk kündigt GROK 3-Schulung in Memphis mit NVIDIA H100-GPUs an
Alibaba Cloud, der Cloud-Computing-Zweig des E-Commerce-Unternehmens, war einer der ersten, der das neue Llama-Modell implementierte. Die Integration in die Bailian-Modell-Schulungsplattform wurde über den offiziellen WeChat-Account von Alibaba bekannt gegeben. Das Unternehmen verschenkt einen Monat Rechenressourcen für Training und Inferenz in Llama 3.1 und unterstreicht damit den Wert des Modells.
Tencent folgt diesem Beispiel und erweitert die Modellfähigkeiten
Llama 3.1, das neueste Mitglied der Open-Source-Llama-Familie großer Sprachmodelle (LLMs), unterstützt generative KI-Anwendungen wie ChatGPT. Nach der Ankündigung von Alibaba folgte schnell die in Shenzhen ansässige Tencent Holdings. Der Ansatz von Tencent umfasst auch die Verbesserung der Feinabstimmung und Schlussfolgerung des Modells für Flexibilität bei verschiedenen Aufgaben wie Konversation, Textgenerierung und Schreiben.
Meta Platforms hat die Llama-Modelle erstellt und sie in drei Größen unterteilt: die 8B-, 70B- und 450B-Llamas, wobei sich die Zahlen auf die Anzahl der Parameter beziehen. Die Anzahl der Parameter ist einer der wesentlichen Faktoren, die die Leistungsfähigkeit des LLM bestimmen, da mehr Parameter eine höhere Kapazität bedeuten.
Zuckerberg positioniert Llama 3.1 als Open-Source-Grenze
Mark Zuckerberg, CEO von Meta, hat betont, dass „dezentrale und offene Innovation“ im aktuellen Klima von Spionage und Modelldiebstahl von Vorteil sei. Er sagte, dass „dezentrale und offene Innovation“ für die USA von Vorteil sei und verriet, dass die zukünftigen Llama-Modelle ab dem nächsten Jahr die besten auf dem Markt sein würden.
Zuckerberg erklärte, dass zukünftige Llama-Modelle diese Lücke zwischen Open-Source- und den besten Closed-Source-Modellen, die derzeit in der Branche verfügbar sind, verringern werden. Er erklärte weiter, dass die Llama-Modelle bis Ende nächsten Jahres die anspruchsvollsten auf dem Markt sein werden.
Llama 3.1 hat bei chinesischen Startups große Aufmerksamkeit erregt, da diese Llama-Modelle als Grundlage für die Erstellung generativer KI-Anwendungen verwenden. Dennoch gibt es in der Branche einige Skeptiker, die von einem übermäßigen Einsatz der Meta-Modelle abraten. Der Fall des chinesischen KI-Einhorns ist ein Beispiel für eine solche Technologie.
Derzeit hat LMSYS, eine Forschungseinrichtung für KI-Modelle der University of California, Berkeley, Closed-Source-Modelle von OpenAI, Anthropic und Google an die Spitze gesetzt. GPT-4 von OpenAI belegt den ersten Platz, während Modelle dieser Unternehmen die ersten zehn Plätze belegen.