ElevenLabs, ein Pionier-Startup im Bereich KI-gestützter Stimmklonierung, hat in einer kürzlich abgeschlossenen Series-B-Finanzierungsrunde beeindruckende 80 Millionen US-Dollar eingesammelt. Die Runde, die von renommierten Investoren wie Andreessen Horowitz, dem ehemaligen GitHub-CEO Nat Friedman und dem Unternehmer Daniel Gross angeführt wurde, katapultierte das Unternehmen in den Unicorn-Status und bewertet es mit über einer Milliarde US-Dollar. Mit diesem Kapitalzufluss plant ElevenLabs, seine Produkte weiter zu verbessern, seine Infrastruktur und sein Team auszubauen, in die KI-Forschung einzusteigen und Sicherheitsmaßnahmen zu priorisieren, um die verantwortungsvolle und ethische Entwicklung von KI-Technologie zu gewährleisten.
KI-gestütztes Klonen von Stimmen
ElevenLabs wurde 2022 von Piotr Dabkowski, einem ehemaligen Machine-Learning-Ingenieur bei Google, und Mati Staniszewski, einem ehemaligen Deployment-Strategen bei Palantir, gegründet. Ziel des Unternehmens ist die Entwicklung KI-gestützter Tools zur Erzeugung und Bearbeitung synthetischer Stimmen. Inspiriert wurden sie von schlecht synchronisierten amerikanischen Filmen und der Überzeugung, dass KI diesen Prozess deutlich verbessern könnte. Das Startup brachte vor etwa einem Jahr seine browserbasierte Sprachgenerierungs-App auf den Markt, mit der Nutzer lebensechte Stimmen mit anpassbaren Parametern für Intonation, Emotionen, Kadenz und andere Stimmmerkmale erstellen können.
ElevenLabs bietet sowohl kostenlose als auch kostenpflichtige Optionen. Kostenlose Nutzer können Texte eingeben und sich diese von Standardstimmen vorlesen lassen, während zahlende Kunden Sprachproben hochladen und mithilfe der Stimmklon-Technologie von ElevenLabs individuelle Sprachstile erstellen können. Darüber hinaus erweitert das Unternehmen sein Angebot um Hörbücher, Synchronisationen für Filme und Fernsehsendungen sowie die Generierung von Charakterstimmen für Spiele und Marketingkampagnen.
Innovationen und Kunden
Eine der bemerkenswertesten Innovationen von ElevenLabs ist das „Sprache-zu-Sprache“-Tool. Es wurde entwickelt, um Stimme, Prosodie und Intonation des Sprechers zu erhalten und gleichzeitig Hintergrundgeräusche zu eliminieren. Zudem übersetzt und synchronisiert es Sprache mit dem Ausgangsmaterial – ein besonders wertvolles Feature für Filme und Fernsehsendungen. Zukünftige Entwicklungen umfassen einen Workflow für Synchronstudios mit Transkriptions- und Übersetzungstools sowie eine abonnementbasierte mobile App, die Webseiten und Texte mit den Stimmen von ElevenLabs vertont.
Die Innovationen des Unternehmens haben Kunden wie Paradox Interactive, einen renommierten Spieleentwickler, bekannt für Titel wie Cities: Skylines 2 und Stellaris, sowie die Washington Post und weitere Medien- und Unterhaltungsunternehmentrac. ElevenLabs rühmt sich damit, dass Nutzer Audioinhalte im Umfang von über 100 Jahren Audiomaterial generiert haben und dass Mitarbeiter von 41 % der Fortune-500-Unternehmen die Plattform nutzen.
Kontroversen und ethische Bedenken
Trotz seines Erfolgs blieb ElevenLabs nicht ohne Kontroversen. Die Plattform wurde missbräuchlich genutzt, um Stimmen zu klonen und schädliche Inhalte, darunter Gewaltandrohungen und Hassrede, zu verbreiten. Als Reaktion darauf hat ElevenLabs Maßnahmen ergriffen, um missbräuchliche Nutzer zu identifizieren und Tools zur Erkennung von über die Plattform erstellten Inhalten implementiert. Darüber hinaus plant das Unternehmen, mit Vertriebspartnern zusammenzuarbeiten, um dieses Tool auch auf Drittanbieterplattformen verfügbar zu machen.
Das Startup sieht sich auch Kritik von Synchronsprechern ausgesetzt, die behaupten, ElevenLabs verwende Sprachproben ohne ihre Zustimmung, was möglicherweise zur Verbreitung von Inhalten führe, die sie nicht unterstützen. Einige wurden sogar Opfer von Belästigungskampagnen mit geklonten Stimmen. Innerhalb der Synchronsprecherbranche wächst zudem die Sorge, dass menschliche Sprecher durch KI-generierte Stimmen verdrängt werden könnten, insbesondere in schlechter bezahlten Einstiegspositionen.
Die Lösung von ElevenLabs und der Wettbewerb
Um diesen Bedenken zu begegnen, hat ElevenLabs einen Marktplatz für Stimmen eingeführt, auf dem Nutzer Stimmen erstellen, verifizieren und teilen können. Die Urheber erhalten eine Vergütung, wenn andere ihre Stimmen nutzen, wodurch sie die Verfügbarkeit und die Vergütungsbedingungen selbst bestimmen können. Anstelle einer monetären Vergütung erhalten die Urheber derzeit jedoch Guthaben für die Premium-Dienste von ElevenLabs.
Das Startup ElevenLabs steht im Wettbewerb mit anderen Anbietern im Bereich synthetischer Stimmen, darunter Papercup, Deepdub, Acapela, Respeecher und Voice.ai, sowie etablierten Tech-Giganten wie Amazon, Microsoft und Google. ElevenLabs plant, sein Wachstum fortzusetzen und sein Team bis Ende des Jahres von 40 auf 100 Mitarbeiter zu erweitern, um im schnell wachsenden Markt für synthetische Stimmen eine bedeutende Rolle zu spielen.
ElevenLabs, mit einer beeindruckenden Finanzierung von 80 Millionen US-Dollar und einer Bewertung von über einer Milliarde US-Dollar, entwickelt sich zu einem dominanten Akteur in der KI-gestützten Sprachkopierbranche. Während die Innovationen des Unternehmens Lob erhalten und hochkarätige Kundentrachaben, sah sich das Startup auch Kritik und ethischen Bedenken hinsichtlich des Missbrauchs seiner Technologie und der potenziellen Bedrohung für den Berufsstand der Synchronsprecher ausgesetzt. ElevenLabs geht diese Probleme jedoch aktiv an, indem es verbesserte Sicherheitsvorkehrungen trifft und einen Marktplatz für Sprachproduzenten bereitstellt. Angesichts der Konkurrenz durch andere aufstrebende Startups und Tech-Giganten bleibt ElevenLabs dem Ziel treu, den Markt für synthetische Stimmen weiterzuentwickeln und gleichzeitig die komplexen ethischen Herausforderungen und den Umbruch in der Branche zu meistern.

