ElevenLabs, una startup pionera en el campo de la clonación de voz con IA, ha conseguido la impresionante suma de 80 millones de dólares en una reciente ronda de financiación de Serie B. Esta ronda, codirigida por inversores de renombre como Andreessen Horowitz, el exdirector ejecutivo de GitHub, Nat Friedman, y el emprendedor Daniel Gross, ha catapultado a la empresa a la categoría de unicornio, valorándola en más de mil millones de dólares. Con esta entrada de capital, ElevenLabs planea seguir mejorando sus productos, ampliar su infraestructura y equipo, dedicarse a la investigación en IA y priorizar las medidas de seguridad para garantizar el desarrollo responsable y ético de la tecnología de IA.
Clonación de voz impulsada por IA
Fundada en 2022 por Piotr Dabkowski, exingeniero de aprendizaje automático de Google, y Mati Staniszewski, exestratega de implementación de Palantir, ElevenLabs se propuso crear herramientas basadas en IA capaces de producir y editar voces sintéticas. Su inspiración surgió de películas estadounidenses con doblajes deficientes, con la convicción de que la IA podría mejorar significativamente este proceso. La startup lanzó su aplicación de generación de voz para navegador hace aproximadamente un año, que permite a los usuarios crear voces realistas con parámetros ajustables de entonación, emoción, cadencia y otras características vocales.
ElevenLabs ofrece opciones gratuitas y de pago. Los usuarios de la versión gratuita pueden introducir texto y recibir una grabación leída en voz alta con las voces predeterminadas, mientras que los clientes de pago pueden subir muestras de voz para crear estilos únicos utilizando la tecnología de clonación de voz de ElevenLabs. Además, la compañía está ampliando su oferta para ofrecer audiolibros, doblaje de películas y series de televisión, y la generación de voces de personajes para videojuegos y campañas de marketing.
Innovaciones y clientes
Una de las innovaciones más destacadas de ElevenLabs es su herramienta de "voz a voz", diseñada para preservar la voz, la prosodia y la entonación del hablante, eliminando el ruido de fondo. También traduce y sincroniza el habla con el material original, lo cual es especialmente útil para películas y series de televisión. Entre sus próximos desarrollos se incluye un flujo de trabajo para estudios de doblaje con herramientas de transcripción y traducción, así como una aplicación móvil de suscripción que narra páginas web y textos con las voces de ElevenLabs.
Las innovaciones de la compañía hantraca clientes como Paradox Interactive, un destacado desarrollador de videojuegos conocido por títulos como Cities: Skylines 2 y Stellaris, y The Washington Post, entre otras empresas de medios y entretenimiento. ElevenLabs presume de que los usuarios han generado contenido de audio equivalente a más de 100 años de audio, y los empleados del 41 % de las empresas de Fortune 500 utilizan su plataforma.
Controversias y preocupaciones éticas
A pesar de su éxito, ElevenLabs no ha estado exento de controversia. La plataforma se ha utilizado con fines maliciosos, permitiendo a personas clonar voces y difundir contenido dañino, incluyendo amenazas de violencia e incitación al odio. En respuesta, ElevenLabs ha tomado medidas para erradicar a los usuarios abusivos e implementado herramientas para detectar el discurso creado a través de su plataforma. Además, planean colaborar con socios de distribución para que esta herramienta esté disponible en plataformas de terceros.
La startup también ha recibido críticas de actores de doblaje que afirman que ElevenLabs utiliza muestras de sus voces sin su consentimiento, lo que podría llevar a la promoción de contenido que no respaldan. Algunos han sufrido campañas de acoso con voces clonadas. Existe también una creciente preocupación en la industria del doblaje por el posible desplazamiento de actores humanos por voces generadas por IA, especialmente en puestos de nivel inicial con salarios más bajos.
La solución y la competencia de ElevenLabs
Para abordar estas inquietudes, ElevenLabs ha introducido un mercado de voces que permite a los usuarios crear, verificar y compartir voces. Los creadores reciben una compensación cuando otros usan sus voces, lo que les da control sobre la disponibilidad y las condiciones de la compensación. Sin embargo, en lugar de una compensación monetaria, actualmente reciben crédito para los servicios premium de ElevenLabs.
La startup se enfrenta a la competencia de otros actores del sector de la voz sintética, como Papercup, Deepdub, Acapela, Respeecher y Voice.ai, así como de gigantes tecnológicos consolidados como Amazon, Microsoft y Google. ElevenLabs planea continuar su crecimiento, ampliando su equipo de 40 a 100 empleados para finales de año, con la determinación de generar un impacto significativo en el creciente mercado de la voz sintética.
ElevenLabs, con una impresionante financiación de 80 millones de dólares y una valoración de más de mil millones de dólares, se perfila como una fuerza dominante en la industria de la clonación de voz con IA. Si bien sus innovaciones han recibido elogios y hantraca clientes de primer nivel, la startup también ha enfrentado críticas y preocupaciones éticas relacionadas con el uso indebido de su tecnología y la posible amenaza que representa para la profesión de locutor. No obstante, ElevenLabs está abordando activamente estos problemas mediante la mejora de las medidas de seguridad y un mercado para creadores de voces. Ante la competencia de otras startups emergentes y gigantes tecnológicos, ElevenLabs mantiene su compromiso de impulsar el mercado de la voz sintética, a la vez que aborda las complejidades de la ética y la disrupción del sector.

