NEUESTE NACHRICHTEN
FÜR SIE AUSGEWÄHLT
WÖCHENTLICH
BLEIBEN SIE AN DER SPITZE

Die besten Krypto-Einblicke direkt in Ihren Posteingang.

Google DeepMind entwickelt V2A, das Ton für KI-Videos erzeugt

VonEnacy MapakameEnacy Mapakame
2 Minuten Lesezeit
DeepMind
  • Mit dem V2A-Tool lassen sich unbegrenzt vieletracfür jede beliebige Videoausgabe generieren.
  • DeepMind wird sich Zeit lassen, bis V2A der Öffentlichkeit zugänglich gemacht wird, da das Tool strengen Sicherheitsprüfungen unterzogen wird.
  • V2A ist mit Videogenerierungstools wie Veo kompatibel und ordnetmaticdie passenden Sounds den entsprechenden Szenen zu.

DeepMind, Googles KI-Forschungslabor, hat bekannt gegeben, dass es an einem KI-Tool namens V2A arbeitet, das Ton und Dialoge für KI-generierte Videos erzeugen kann. V2A (Video-zu-Audio) nutzt textbasierte Anweisungen und Videopixel, um Dialoge, Musik und Soundeffekte für Videos zu generieren.

Lesen Sie auch: Google DeepMind stellt TacticAI vor: Revolutionierung der Fußballtaktik

Laut DeepMind passen die generierten Soundeffekte und die Musik zum beabsichtigten Ton und den Charakteren des Videos. DeepMind erklärte weiter, dass die Technologie dazu beitragen könne, KI-generierte Videos lebendiger zu gestalten.

V2A gleicht Audio- und Videoszenen ab

Während die Technologie zur Audioerzeugung nichts Neues ist, behauptet DeepMind, dass sein V2A-Tool das erste seiner Art sei, das Audio und Videomaticsynchronisiert.

„Die Modelle zur Videogenerierung entwickeln sich in einem unglaublichen Tempo, aber viele der derzeitigen Systeme können nur stumme Ausgaben erzeugen“, schrieb DeepMind in einem Blogbeitrag.

„Durch das Training mit Video, Audio und den zusätzlichen Anmerkungen lernt unsere Technologie, bestimmte Audioereignisse mit verschiedenen visuellen Szenen zu verknüpfen und dabei auf die in den Anmerkungen oder Transkripten enthaltenen Informationen zu reagieren.“

DeepMind.

Das Unternehmen fügte hinzu, dass seine Technologie automatischmatic im Gegensatz zu einer zeitaufwändigen manuellen Ausrichtung, bei der Töne, Videos und Zeitpunkte angepasst werden müssten.

Laut DeepMind kann das V2A-Tool verwendet werden, um eine unbegrenzte Anzahl vontracfür jede Videoausgabe zu generieren. Eine positive Vorgabe kanndefiwerden, um die generierte Ausgabe in Richtung gewünschter Töne zu lenken, oder eine negative Vorgabe, um sie von unerwünschten Tönen wegzulenken

„Diese Flexibilität gibt den Nutzern mehr Kontrolle über die Ausgabe des V2A und ermöglicht es ihnen, schnell mit verschiedenen Audioausgängen zu experimentieren und die beste Übereinstimmung auszuwählen“, so das Unternehmen.

Deepmind lässt sich von der Konkurrenz nicht beeindrucken

brachte die Serie-B-Finanzierungsrunde 80 Millionen US-Dollar ein und bewertete das Unternehmen mit über einer Milliarde US-Dollar Verdict.

Das Unternehmen gibt an, dass seine Nutzer über 100 Jahre Audiomaterial generiert haben. Es behauptet außerdem, dass seine Audio-Software derzeit von 41 % der Fortune-500-Unternehmen genutzt wird.

Lesen Sie auch: Google DeepMind vs. OpenAI: Das Rennen um die KI-Videogenerierung spitzt sich zu

Trotz dieser Konkurrenz hat DeepMind signalisiert, dass sie es nicht eilig haben, die Technologie der Öffentlichkeit zugänglich zu machen.

„Bevor wir den Zugang für die breite Öffentlichkeit ermöglichen, wird unsere V2A-Technologie strengen Sicherheitsbewertungen und Tests unterzogen“, so das Unternehmen.

DeepMind wies außerdem darauf hin, dass V2A mit Videogenerierungsmodellen wie Veo, was zur Erzeugung realistischer Soundeffekte beiträgt.


Cryptopolitan Berichterstattung von Enacy Mapakame

Die klügsten Köpfe der Krypto-Szene lesen bereits unseren Newsletter. Möchten Sie auch dabei sein? Dann schließen Sie sich ihnen an.

Diesen Artikel teilen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtronempfehlen dringend, vor jeder Anlageentscheidung eigene Recherchen durchzuführendent oder einen qualifizierten Fachmann zu konsultieren

Enacy Mapakame

Enacy Mapakame

Enacy Mapakame ist Journalistin mit über zehn Jahren Erfahrung im Bereich Wirtschafts- und Finanznachrichten. Sie berichtet über Kapitalmärkte und Zukunftstechnologien – Metaverse, KI und Kryptowährungen. Enacy besitzt einen Bachelor of Science (BSc) mit Auszeichnung in Medien- und Gesellschaftswissenschaften.

MEHR … NACHRICHTEN
DEEP CRYPTO
CRASH-KURS