Cargando...

Google DeepMind desarrolla V2A que crea sonido para vídeos con IA

En esta publicación:

  • La herramienta V2A se puede utilizar para generar un número ilimitado de trac de sonido para cualquier salida de vídeo.
  • DeepMind se tomará su tiempo para lanzar V2A al público mientras la herramienta se somete a rigurosas evaluaciones de seguridad.
  • V2A se puede combinar con herramientas de generación de vídeo como Veo y asocia matic los sonidos con las escenas apropiadas.

DeepMind, el laboratorio de investigación de inteligencia artificial de Google, ha revelado que está trabajando en una herramienta de inteligencia artificial conocida como V2A, que puede crear sonido y diálogos para videos generados por inteligencia artificial. V2A, que significa video a audio, utiliza indicaciones basadas en texto y píxeles de video para generar diálogos, música y efectos de sonido para videos.

Lea también: Google DeepMind presenta TacticAI: revolucionando las tácticas de fútbol

Según DeepMind, los efectos de sonido y la música generados coinciden con el tono y los personajes previstos del vídeo. DeepMind explicó además que la tecnología podría ayudar a dar más vida a los vídeos generados por IA.

V2A une escenas de audio con vídeo

Si bien la tecnología de generación de audio no es nada nuevo, DeepMind afirma que su herramienta V2A es la primera de su tipo, que relaciona matic el audio con el vídeo.

"Los modelos de generación de vídeo están avanzando a un ritmo increíble, pero muchos sistemas actuales sólo pueden generar resultados silenciosos", escribió DeepMind en una entrada de blog .

"Al entrenarse en video, audio y anotaciones adicionales, nuestra tecnología aprende a asociar eventos de audio específicos con varias escenas visuales, mientras responde a la información proporcionada en las anotaciones o transcripciones".

Mente profunda.

La compañía agregó que su tecnología es automática matic a diferencia de la alineación manual que requiere mucho tiempo y que requiere ajustar sonidos, videos y tiempos.

Según DeepMind, la herramienta V2A se puede utilizar para generar un número ilimitado de trac de sonido para cualquier salida de vídeo. Se puede “ defi un mensaje positivo para guiar la salida generada hacia los sonidos deseados, o un mensaje negativo para alejarlo de los sonidos no deseados”.

"Esta flexibilidad brinda a los usuarios más control sobre la salida de V2A, lo que permite experimentar rápidamente con diferentes salidas de audio y elegir la mejor combinación", dijo la compañía.

Deepmind indiferente a la competencia

La última innovación llega cuando DeepMind quiere consolidar su dominio en la industria. A principios de este año, la empresa británica de generación de voz mediante IA, ElevenLabs, logró un hito después de que su ronda de financiación serie B generara 80 millones de dólares, valorando a la empresa en más de mil millones de dólares, según Verdict .

La compañía dice que sus usuarios han generado más de 100 años de audio. También afirma que su software de audio es utilizado actualmente por el 41% de las empresas Fortune 500.

Lea también: Google DeepMind vs. OpenAI: la carrera en la generación de videos con IA se calienta

A pesar de esta competencia, DeepMind ha indicado que no tienen prisa por lanzar la tecnología al público.

"Antes de que consideremos abrir el acceso al público en general, nuestra tecnología V2A se someterá a rigurosas evaluaciones y pruebas de seguridad", dijo la compañía.

DeepMind también indicó que V2A se puede combinar con modelos de generación de video como Veo , lo que ayuda a crear efectos de sonido realistas.


Informe criptopolitano de Enacy Mapakame

Descargo de responsabilidad. La información proporcionada no es un consejo comercial. Cryptopolitan.com no asume ninguna responsabilidad por las inversiones realizadas en función de la información proporcionada en esta página. Recomendamos tron dent independiente y/o la consulta con un profesional calificado antes de tomar cualquier decisión de inversión.

Compartir enlace:

Mas leido

Cargando los artículos más leídos...

Manténgase al tanto de las noticias sobre criptomonedas y reciba actualizaciones diarias en su bandeja de entrada

Noticias relacionadas

Microsoft cuestiona las regulaciones de la UE en medio de preocupaciones de seguridad de Windows
criptopolitano
Suscríbete a CryptoPolitan