ElevenLabs, une startup pionnière dans le domaine du clonage vocal par intelligence artificielle, a levé la somme impressionnante de 80 millions de dollars lors d'un récent tour de table de série B. Ce tour de table, mené conjointement par des investisseurs de renom tels qu'Andreessen Horowitz, l'ancien PDG de GitHub, Nat Friedman, et l'entrepreneur Daniel Gross, a propulsé l'entreprise au rang de licorne, la valorisant à plus d'un milliard de dollars. Grâce à cet apport de capitaux, ElevenLabs prévoit d'améliorer ses produits, de développer son infrastructure et ses équipes, de poursuivre ses recherches en IA et de prioriser les mesures de sécurité afin de garantir un développement responsable et éthique de cette technologie.
Clonage vocal par intelligence artificielle
Fondée en 2022 par Piotr Dabkowski, ancien ingénieur en apprentissage automatique chez Google, et Mati Staniszewski, ancien stratège de déploiement chez Palantir, ElevenLabs s'est donné pour mission de créer des outils d'IA capables de produire et de modifier des voix de synthèse. Leur inspiration leur est venue des films américains mal doublés, avec la conviction que l'IA pouvait considérablement améliorer ce processus. La startup a lancé son application de génération vocale pour navigateur il y a environ un an, permettant aux utilisateurs de créer des voix réalistes grâce à des paramètres ajustables pour l'intonation, l'émotion, le rythme et d'autres caractéristiques vocales.
ElevenLabs propose des options gratuites et payantes. Les utilisateurs de la version gratuite peuvent saisir du texte et écouter un enregistrement lu à voix haute par des voix prédéfinies, tandis que les clients payants peuvent importer des échantillons vocaux pour créer des styles uniques grâce à la technologie de clonage vocal d'ElevenLabs. Par ailleurs, l'entreprise étend son offre aux livres audio, au doublage de films et de séries télévisées, ainsi qu'à la création de voix de personnages pour les jeux vidéo et les campagnes marketing.
Innovations et clients
L'une des innovations majeures d'ElevenLabs est son outil de synthèse vocale, conçu pour préserver la voix, la prosodie et l'intonation de l'orateur tout en éliminant les bruits de fond. Il traduit et synchronise également la parole avec le contenu source, ce qui est particulièrement précieux pour les films et les séries télévisées. Parmi les développements à venir figurent un flux de travail de studio de doublage avec des outils de transcription et de traduction, ainsi qu'une application mobile par abonnement qui permet de narrer les pages web et les textes à l'aide des voix d'ElevenLabs.
Les innovations de l'entreprise onttracdes clients tels que Paradox Interactive, un développeur de jeux vidéo de renom connu pour des titres comme Cities: Skylines 2 et Stellaris, et le Washington Post, parmi d'autres entreprises des médias et du divertissement. ElevenLabs affirme que ses utilisateurs ont généré un contenu audio équivalent à plus de 100 ans d'enregistrement, et que 41 % des entreprises du classement Fortune 500 utilisent sa plateforme.
Controverses et préoccupations éthiques
Malgré son succès, ElevenLabs n'a pas été exempt de controverses. La plateforme a été utilisée à des fins malveillantes, permettant à des individus de cloner des voix et de diffuser des contenus nuisibles, notamment des menaces de violence et des discours haineux. En réponse, ElevenLabs a pris des mesures pour éradiquer les utilisateurs abusifs et a mis en place des outils de détection des contenus vocaux créés via sa plateforme. De plus, l'entreprise prévoit de collaborer avec des partenaires de distribution afin de rendre cet outil disponible sur des plateformes tierces.
La start-up a également essuyé des critiques de la part de comédiens de doublage qui affirment qu'ElevenLabs utilise des échantillons de leurs voix sans leur consentement, ce qui pourrait mener à la promotion de contenus qu'ils désapprouvent. Certains ont même été victimes de harcèlement impliquant des voix clonées. Au sein du secteur du doublage, l'inquiétude grandit quant au risque de voir les comédiens humains remplacés par des voix générées par IA, notamment pour les rôles débutants et les moins bien rémunérés.
La solution et la concurrence d'ElevenLabs
Pour répondre à ces préoccupations, ElevenLabs a lancé une plateforme de partage de voix, permettant aux utilisateurs de créer, de vérifier et de partager leurs voix. Les créateurs sont rémunérés lorsque leurs voix sont utilisées, ce qui leur permet de contrôler leur disponibilité et les conditions de rémunération. Cependant, au lieu d'une compensation financière, les créateurs reçoivent actuellement des crédits utilisables pour les services premium d'ElevenLabs.
La start-up ElevenLabs fait face à la concurrence d'autres acteurs du secteur de la voix de synthèse, tels que Papercup, Deepdub, Acapela, Respeecher et Voice.ai, ainsi que de géants technologiques établis comme Amazon, Microsoft et Google. Forte de son ambition de poursuivre sa croissance et d'accroître ses effectifs de 40 à 100 employés d'ici la fin de l'année, ElevenLabs ambitionne de marquer durablement le marché en pleine expansion de la voix de synthèse.
Avec un financement impressionnant de 80 millions de dollars et une valorisation de plus d'un milliard de dollars, ElevenLabs s'impose comme un acteur majeur du clonage vocal par intelligence artificielle. Si ses innovations ont été saluées et lui ont permis d'tracdes clients prestigieux, la startup a également fait face à des critiques et à des préoccupations éthiques liées à l'utilisation abusive de sa technologie et à la menace potentielle qu'elle représente pour le métier de comédien de doublage. ElevenLabs s'attelle néanmoins à résoudre ces problèmes en renforçant ses mesures de sécurité et en créant une plateforme pour les créateurs de voix. Face à la concurrence d'autres startups émergentes et de géants de la tech, ElevenLabs reste déterminée à faire progresser le marché de la voix de synthèse tout en gérant les complexités éthiques et les bouleversements du secteur.

