NEUESTE NACHRICHTEN
FÜR SIE AUSGEWÄHLT
WÖCHENTLICH
BLEIBEN SIE AN DER SPITZE

Die besten Krypto-Einblicke direkt in Ihren Posteingang.

Alibaba stellt KI-Modell für Video- und Bildgenerierung als Open Source zur Verfügung

VonNellius IreneNellius Irene
3 Minuten Lesezeit
Alibaba stellt KI-Modell für Video- und Bildgenerierung als Open Source zur Verfügung
  • Alibaba stellt sein KI-Modell Wan 2.1 als Open Source zur Verfügung und macht damit seine Technologie zur Video- und Bildgenerierung der Öffentlichkeit zugänglich, um Innovation und Wettbewerb zu fördern.
  • Das Unternehmen veröffentlicht vier Wan 2.1-Varianten, die 14 Milliarden Parameter nutzen, um die Genauigkeit zu verbessern und komplexe Eingaben zu verarbeiten.
  • Alibaba plant eine Investition von 52 Milliarden Dollar in KI und Cloud Computing und plant damit einen der größten Infrastrukturausbauprojekte Chinas in diesem Sektor.

Alibaba Group Holding Ltd. hat bekannt gegeben, dass ihr KI-Modell Wan 2.1 zur Video- und Bildgenerierung ab sofort als Open-Source-Plattform öffentlich verfügbar ist. Dieser Schritt dürfte die Akzeptanz steigern und den Wettbewerb im KI-Bereich verschärfen.

Alibabas Entscheidung deckt sich mit einer ähnlichen Strategie von ByteDance und dem Startup DeepSeek. Anfang des Jahres erregten DeepSeeks kostengünstige Open-Source-Modelle die Aufmerksamkeit von Technologieinvestoren und überraschten die kapitalintensive Branche mit einer Leistung, die mit etablierten Anbietern wie OpenAI vergleichbar ist.

Alibaba erweitert KI-Angebot mit vier WAN 2.1-Varianten

Alibaba hat vier Varianten seines KI-Modells Wan 2.1 veröffentlicht – T2V-1.3B, T2V-14B, I2V-14B-720P und I2V-14B-480P –, die aus Text- und Bildeingaben Bilder und Videos generieren. Die Bezeichnung „14B“ bedeutet, dass diese Varianten 14 Milliarden Parameter verarbeiten und dadurch komplexere Eingaben bewältigen und präzisere Ergebnisse liefern können.

Die Modelle sind weltweit auf den Plattformen ModelScope und HuggingFace von Alibaba Cloud für akademische, Forschungs- und kommerzielle Zwecke verfügbar.

Alibaba stellte im Januar die neueste Version seines KI-Modells zur Video- und Bildgenerierung vor und verkürzte den Namen später von Wanx zu Wan. Das Unternehmen hob die Fähigkeit des Modells hervor, hochrealistische Bilder zu erzeugen. Seitdem betont Alibaba seine Spitzenposition auf VBench, einem Ranking für videogenerative Modelle, wo es insbesondere in Funktionen wie der Interaktion mehrerer Objekte glänzt.

Am Dienstag präsentierte das Unternehmen eine Vorschau seines Reasoning-Modells QwQ-Max, das es nach der vollständigen Veröffentlichung als Open Source zur Verfügung stellen will.

ByteDance bringt OmniHuman auf den Markt, eine KI, die aus einem einzigen Bild Ganzkörpervideos erstellt

Der Boom bei der Entwicklung von Open-Source-KI geht einher mit bedeutenden Fortschritten der Konkurrenz. ByteDance, die Muttergesellschaft von TikTok, kündigte kürzlich die Einführung von OmniHuman, einem fortschrittlichen KI-System, das aus nur einem Foto ein komplettes Ganzkörpervideo generieren kann.

Was OmniHuman von ähnlichen KI-Systemen unterscheidet, ist die Fähigkeit, dynamische Videos zu erstellen, in denen die Person spricht, gestikuliert und sich natürlich bewegt. Das System wurde mit über 19.000 Stunden Videomaterial trainiert und nutzt diese Daten, um Videos zu erstellen, die menschliches Verhalten in Bezug auf Bewegungen und Mimik nachahmen.

Eine der ersten Demonstrationen von OmniHuman war ein Video von Albert Einstein bei einem Vortrag. Das Video verbreitete sich im Internet sofort nach der Veröffentlichung rasant und beweist damit, welch großen Unterschied diese Funktion ausmacht.

OmniHuman ist zwar das erste KI-System, das behauptet, mit nur einem Bild ein glaubwürdiges Video erzeugen zu können, aber andere Systeme können mit wenigen Bildern ähnliche Ergebnisse liefern.

Da wäre zum Beispiel Pollo AI, mit dem Nutzer Videos durch Hochladen von Bildern erstellen können. Es ist einfach zu bedienen und kann anhand von Bildern und einer Textvorgabe Videos in vom NutzerdefiStilen erstellen.

Canva bietet einen ähnlichen KI-Videogenerator. Dank der zahlreichen Vorlagen und Bearbeitungsfunktionen können auch Nutzer ohne fortgeschrittene Videokenntnisse problemlos KI-generierte Videos aus Bildern erstellen.

Freepik verfügt außerdem über einen ähnlichen KI-Videogenerator, der verschiedene Generierungsmodi und Anpassungsmöglichkeiten bietet, um mit nur Bildern und Eingabeaufforderungen ansprechende Videos zu erstellen.

Alibaba investiert 52 Milliarden US-Dollar in KI und Cloud-Erweiterung

Vor wenigen Tagen kündigte Alibaba Pläne an, in den nächsten drei Jahren mindestens 380 Milliarden Yuan (52 Milliarden US-Dollar) zu investieren, um seine Cloud-Computing- und KI-Infrastruktur zu stärken.

Der Internetriese, dessen Mitgründer Jack Ma ist, wird mehr in seine Infrastruktur für künstliche Intelligenz und Cloud Computing investieren als in den letzten zehn Jahren. Angesichts der zunehmend rechenintensiven Geschäftsmodelle erklärte das Unternehmen in seinem offiziellen Blog, Alibaba wolle sich als Partner für Unternehmen positionieren, die KI in der Praxis entwickeln und einsetzen.

Dieses Vorhaben zählt zu Chinas größten Investitionen in KI-Infrastruktur und unterstreicht Alibabas wachsende Ambitionen in diesem Bereich. Gleichzeitig bestehen jedoch Bedenken von Investoren, ob einige große Technologiekonzerne die zukünftige Nachfrage nach KI-Dienstleistungen überschätzen oder die Kapitalkosten für deren Entwicklung unterschätzen werden.

Analysten von TD Cowen wiesen am Freitag darauf hin, dass Microsoft in den USA Mietverträge für umfangreiche Rechenzentrumskapazitäten kündigt. Dieser Schritt könnte auf Bedenken hindeuten, ob das Unternehmen langfristig mehr KI-Rechenkapazität aufbaut, als es benötigt. Die Aktien von Alibaba in Hongkong gaben am Montag um bis zu 3 % nach.

Andere große Technologieunternehmen wie Meta Platforms Inc. und Amazon.com Inc. versprechen Milliardenbeträge für den Bau der Rechenzentren, die für das Training, die Entwicklung und das Hosting von KI-Diensten benötigt werden.

Wenn Sie das hier lesen, sind Sie schon einen Schritt voraus. Bleiben Sie mit unserem Newsletter auf dem Laufenden.

Diesen Artikel teilen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtronempfehlen dringend, vor jeder Anlageentscheidung eigene Recherchen durchzuführendent oder einen qualifizierten Fachmann zu konsultieren

Nellius Irene

Nellius Irene

Nellius hat einen Abschluss in Betriebswirtschaft und IT und verfügt über fünf Jahre Erfahrung in der Kryptowährungsbranche. Sie ist außerdem Absolventin des Bitcoin Dada-Programms. Nellius hat für führende Medien wie BanklessTimes, Cryptobasic und Riseup Media geschrieben.

MEHR … NACHRICHTEN
DEEP CRYPTO
CRASH-KURS