NEUESTE NACHRICHTEN

Alephium warnt davor, bis auf Weiteres Liquidität abzuziehen, da Hacker 815.000 US-Dollar erbeutet haben

vom 30. Mai 2026 Nachrichten
Zama: Der Einfrieren des Smarttracder cUSDC war ein Kollateralschaden des Overnight Finance-Rugpulls

vom 30. Mai 2026 Nachrichten
Der ehemalige NBA-Veteran Tristan Thompson sorgt mit einer Klage über 2 Millionen Dollar und einem Ultimatum zur Vasektomie für Schlagzeilen

vom 30. Mai 2026 Nachrichten
Hacker erbeuten 5,4 Millionen Dollar von Ethereum - Cosmos Brücke von Gravity

vom 30. Mai 2026 Nachrichten

FÜR SIE AUSGEWÄHLT

WÖCHENTLICH

BLEIBEN SIE AN DER SPITZE

Die besten Krypto-Einblicke direkt in Ihren Posteingang.

Google DeepMind entwickelt V2A, das Ton für KI-Videos erzeugt

Von

Enacy Mapakame

2 Minuten Lesezeit , 18. Juni 2024

Mit dem V2A-Tool lassen sich unbegrenzt vieletracfür jede beliebige Videoausgabe generieren.
DeepMind wird sich Zeit lassen, bis V2A der Öffentlichkeit zugänglich gemacht wird, da das Tool strengen Sicherheitsprüfungen unterzogen wird.
V2A ist mit Videogenerierungstools wie Veo kompatibel und ordnetmaticdie passenden Sounds den entsprechenden Szenen zu.

DeepMind, Googles KI-Forschungslabor, hat bekannt gegeben, dass es an einem KI-Tool namens V2A arbeitet, das Ton und Dialoge für KI-generierte Videos erzeugen kann. V2A (Video-zu-Audio) nutzt textbasierte Anweisungen und Videopixel, um Dialoge, Musik und Soundeffekte für Videos zu generieren.

Lesen Sie auch: Google DeepMind stellt TacticAI vor: Revolutionierung der Fußballtaktik

Laut DeepMind passen die generierten Soundeffekte und die Musik zum beabsichtigten Ton und den Charakteren des Videos. DeepMind erklärte weiter, dass die Technologie dazu beitragen könne, KI-generierte Videos lebendiger zu gestalten.

V2A gleicht Audio- und Videoszenen ab

Während die Technologie zur Audioerzeugung nichts Neues ist, behauptet DeepMind, dass sein V2A-Tool das erste seiner Art sei, das Audio und Videomaticsynchronisiert.

„Die Modelle zur Videogenerierung entwickeln sich in einem unglaublichen Tempo, aber viele der derzeitigen Systeme können nur stumme Ausgaben erzeugen“, schrieb DeepMind in einem Blogbeitrag.

„Durch das Training mit Video, Audio und den zusätzlichen Anmerkungen lernt unsere Technologie, bestimmte Audioereignisse mit verschiedenen visuellen Szenen zu verknüpfen und dabei auf die in den Anmerkungen oder Transkripten enthaltenen Informationen zu reagieren.“

DeepMind.

Das Unternehmen fügte hinzu, dass seine Technologie automatischmatic im Gegensatz zu einer zeitaufwändigen manuellen Ausrichtung, bei der Töne, Videos und Zeitpunkte angepasst werden müssten.

Laut DeepMind kann das V2A-Tool verwendet werden, um eine unbegrenzte Anzahl vontracfür jede Videoausgabe zu generieren. Eine positive Vorgabe kanndefiwerden, um die generierte Ausgabe in Richtung gewünschter Töne zu lenken, oder eine negative Vorgabe, um sie von unerwünschten Tönen wegzulenken

„Diese Flexibilität gibt den Nutzern mehr Kontrolle über die Ausgabe des V2A und ermöglicht es ihnen, schnell mit verschiedenen Audioausgängen zu experimentieren und die beste Übereinstimmung auszuwählen“, so das Unternehmen.

Wir berichten über die Fortschritte unserer Video-zu-Audio-Technologie (V2A). 🎥

Es kann stummen Clips Ton hinzufügen, der zur Akustik der Szene passt, das Geschehen auf dem Bildschirm begleiten und vieles mehr.

Hier sind 4 Beispiele – Ton an! 🧵🔊 https://t.co/VHpJ2cBr24 pic.twitter.com/S5m159Ye62

— Google DeepMind (@GoogleDeepMind) 17. Juni 2024

Deepmind lässt sich von der Konkurrenz nicht beeindrucken

brachte die Serie-B-Finanzierungsrunde 80 Millionen US-Dollar ein und bewertete das Unternehmen mit über einer Milliarde US-Dollar Verdict.

Das Unternehmen gibt an, dass seine Nutzer über 100 Jahre Audiomaterial generiert haben. Es behauptet außerdem, dass seine Audio-Software derzeit von 41 % der Fortune-500-Unternehmen genutzt wird.

Lesen Sie auch: Google DeepMind vs. OpenAI: Das Rennen um die KI-Videogenerierung spitzt sich zu

Trotz dieser Konkurrenz hat DeepMind signalisiert, dass sie es nicht eilig haben, die Technologie der Öffentlichkeit zugänglich zu machen.

„Bevor wir den Zugang für die breite Öffentlichkeit ermöglichen, wird unsere V2A-Technologie strengen Sicherheitsbewertungen und Tests unterzogen“, so das Unternehmen.

DeepMind wies außerdem darauf hin, dass V2A mit Videogenerierungsmodellen wie Veo, was zur Erzeugung realistischer Soundeffekte beiträgt.

Cryptopolitan Berichterstattung von Enacy Mapakame

Die klügsten Köpfe der Krypto-Szene lesen bereits unseren Newsletter. Möchten Sie auch dabei sein? Dann schließen Sie sich ihnen an.

DeepMind ElevenLabs Google

Diesen Artikel teilen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtronempfehlen dringend, vor jeder Anlageentscheidung eigene Recherchen durchzuführendent oder einen qualifizierten Fachmann zu konsultieren

Enacy Mapakame

Enacy Mapakame ist Journalistin mit über zehn Jahren Erfahrung im Bereich Wirtschafts- und Finanznachrichten. Sie berichtet über Kapitalmärkte und Zukunftstechnologien – Metaverse, KI und Kryptowährungen. Enacy besitzt einen Bachelor of Science (BSc) mit Auszeichnung in Medien- und Gesellschaftswissenschaften.

INHALTSVERZEICHNIS

1. V2A gleicht Audio- und Videoszenen ab

2. Deepmind lässt sich von der Konkurrenz nicht beeindrucken

Diesen Artikel teilen

MEHR … NACHRICHTEN

ALLE ANZEIGEN

Was ist Base? Das von Coinbase ins Leben gerufene Ethereum Layer-2-Netzwerk

21. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Dogecoin vs. Bitcoin: Wichtigste technische Unterschiede

20. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist TVL (Total Value Locked) bei Kryptowährungen?

14. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Wie liest man ein Krypto-Whitepaper?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Ripple vs. XRP vs. XRP Ledger: Was ist der Unterschied?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist eine Multisig-Wallet im Kryptobereich?

10. Oktober 2025 Krypto lernen: Leitfaden für Anfänger

DEEP CRYPTO
CRASH-KURS

Mit welchen Kryptowährungen kann man Geld verdienen?
Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
Wenig bekannte Anlagestrategien, die Profis anwenden
Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)

Google DeepMind entwickelt V2A, das Ton für KI-Videos erzeugt

V2A gleicht Audio- und Videoszenen ab

Deepmind lässt sich von der Konkurrenz nicht beeindrucken

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.
Jeden Tag.

Google DeepMind entwickelt V2A, das Ton für KI-Videos erzeugt

V2A gleicht Audio- und Videoszenen ab

Deepmind lässt sich von der Konkurrenz nicht beeindrucken

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.Jeden Tag.

Ein prägnanter Brief.
Jeden Tag.