Your bank is using your money. You’re getting the scraps.WATCH FREE

Google DeepMind développe V2A, un logiciel qui crée du son pour les vidéos d'IA

Dans cet article :

  • L'outil V2A peut être utilisé pour générer un nombre illimité detracaudio pour n'importe quelle sortie vidéo.
  • DeepMind prendra son temps avant de rendre V2A accessible au public, l'outil étant soumis à des évaluations de sécurité rigoureuses.
  • V2A est compatible avec des outils de génération vidéo comme Veo et adaptematicles sons aux scènes appropriées.

DeepMind, le laboratoire de recherche en intelligence artificielle de Google, a révélé travailler sur un outil d'IA nommé V2A, capable de créer du son et des dialogues pour les vidéos générées par l'IA. V2A (Video-to-Audio) utilise des instructions textuelles et des pixels vidéo pour générer des dialogues, de la musique et des effets sonores pour les vidéos.

À lire également : Google DeepMind présente TacticAI : une révolution dans le monde du football

D'après DeepMind, les effets sonores et la musique générés correspondent à l'ambiance et aux personnages de la vidéo. DeepMind explique également que cette technologie pourrait contribuer à donner plus de vie aux vidéos générées par l'IA.

V2A associe l'audio aux scènes vidéo

Bien que la technologie de génération audio ne soit pas nouvelle, DeepMind affirme que son outil V2A est le premier du genre, car il associematicl'audio à la vidéo.

« Les modèles de génération vidéo progressent à un rythme incroyable, mais de nombreux systèmes actuels ne peuvent générer qu’une sortie silencieuse », a écrit DeepMind dans un article de blog .

« Grâce à l’entraînement sur la vidéo, l’audio et les annotations supplémentaires, notre technologie apprend à associer des événements audio spécifiques à diverses scènes visuelles, tout en répondant aux informations fournies dans les annotations ou les transcriptions. »

DeepMind.

L'entreprise a ajouté que sa technologie est automatique matic contrairement à l'alignement manuel fastidieux qui nécessite le réglage des sons, des vidéos et des synchronisations.

Selon DeepMind, l'outil V2A permet de générer un nombre illimité detracaudio pour n'importe quelle sortie vidéo. Une consigne positive peut êtredefipour orienter la sortie générée vers les sons souhaités, ou une consigne négative pour l'éloigner des sons indésirables

Voir aussi :  Les réseaux sociaux inondés d’images générées par l’IA et comment les détecter

« Cette flexibilité offre aux utilisateurs un meilleur contrôle sur la sortie du V2A, ce qui leur permet d'expérimenter rapidement différentes sorties audio et de choisir celle qui leur convient le mieux », a déclaré la société.

DeepMind reste insensible à la concurrence

Cette innovation intervient alors que DeepMind souhaite consolider sa position dominante dans le secteur. Plus tôt cette année, la société britannique ElevenLabs, spécialisée dans les générateurs vocaux par IA, a franchi une étape importante : sa levée de fonds de série B a permis de récolter 80 millions de dollars, valorisant ainsi l’entreprise à plus d’un milliard de dollars, selon Verdict .

L'entreprise affirme que ses utilisateurs ont généré plus de 100 ans d'enregistrement audio. Elle prétend également que son logiciel audio est actuellement utilisé par 41 % des entreprises du classement Fortune 500.

À lire également : Google DeepMind contre OpenAI : la course à la génération vidéo par IA s’intensifie

Malgré cette concurrence, DeepMind a indiqué qu'elle n'était pas pressée de rendre cette technologie publique.

« Avant d’envisager d’ouvrir l’accès au grand public, notre technologie V2A fera l’objet d’évaluations et de tests de sécurité rigoureux », a déclaré l’entreprise.

DeepMind a également indiqué que V2A est compatible avec des modèles de génération vidéo comme Veo , ce qui contribue à créer des effets sonores réalistes.

Voir aussi :  Blue Origin de Bezos entre dans la course à l’exploitation des centres de données spatiaux

Reportage Cryptopolitan par Enacy Mapakame

Vous laissez encore la banque garder le meilleur ? Regardez notre vidéo gratuite sur comment devenir votre propre banque .

Partager le lien :

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. Cryptopolitan.com Cryptopolitan toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous vous recommandons vivement d’effectuer vos tron dent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Articles les plus lus

Chargement des articles les plus lus...

Restez informé(e) de l'actualité crypto, recevez des mises à jour quotidiennes dans votre boîte mail

Choix de la rédaction

Chargement des articles sélectionnés par la rédaction...

- La newsletter crypto qui vous donne une longueur d'avance -

Les marchés évoluent rapidement.

Nous avançons plus vite.

Abonnez-vous à Cryptopolitan Daily et recevez directement dans votre boîte mail des informations crypto pertinentes, pointues et actualisées.

Inscrivez-vous maintenant et
ne manquez plus aucun mouvement.

Entrez. Renseignez-vous.
Prenez de l'avance.

Abonnez-vous à CryptoPolitan