ElevenLabs, новаторский стартап в области клонирования голоса с помощью искусственного интеллекта, привлек впечатляющие 80 миллионов долларов в рамках недавнего раунда финансирования серии B. Этот раунд, возглавляемый такими известными инвесторами, как Andreessen Horowitz, бывший генеральный директор GitHub Нат Фридман и предприниматель Даниэль Гросс, вывел компанию в число «единорогов», оценив ее более чем в 1 миллиард долларов. Благодаря этому притоку капитала ElevenLabs планирует进一步 улучшить свою продукцию, расширить инфраструктуру и команду, заняться исследованиями в области ИИ и уделить приоритетное внимание мерам безопасности для обеспечения ответственного и этичного развития технологий искусственного интеллекта.
клонирование голоса с помощью ИИ
Компания ElevenLabs, основанная в 2022 году Петром Дабковским, бывшим инженером по машинному обучению в Google, и Мати Станишевским, бывшим стратегом по внедрению решений в Palantir, поставила перед собой цель создать инструменты на основе искусственного интеллекта, способные создавать и редактировать синтетические голоса. Вдохновение они черпали из плохо дублированных американских фильмов, полагая, что ИИ может значительно улучшить этот процесс. Примерно год назад стартап запустил свое браузерное приложение для генерации речи, позволяющее пользователям создавать реалистичные голоса с регулируемыми параметрами интонации, эмоций, темпа и других вокальных характеристик.
ElevenLabs предлагает пользователям как бесплатные, так и платные варианты. Бесплатные пользователи могут вводить текст и получать запись, озвученную голосами по умолчанию, а платные клиенты могут загружать образцы голоса для создания уникальных стилей с помощью технологии клонирования голоса ElevenLabs. Кроме того, компания расширяет свои предложения, чтобы озвучивать аудиокниги, дублировать фильмы и телешоу, а также создавать голоса персонажей для игр и маркетинговых кампаний.
Инновации и клиенты
Одно из заметных нововведений ElevenLabs — это инструмент «преобразование речи в речь», разработанный для сохранения голоса, просодии и интонации говорящего, одновременно устраняя фоновый шум. Он также переводит и синхронизирует речь с исходным материалом, что особенно ценно для фильмов и телешоу. В числе будущих разработок — рабочий процесс студии дубляжа с инструментами транскрипции и перевода, а также мобильное приложение по подписке, которое будет озвучивать веб-страницы и текст, используя голоса ElevenLabs.
Инновации компанииtracтаких клиентов, как Paradox Interactive, известный разработчик игр, прославившийся такими проектами, как Cities: Skylines 2 и Stellaris, а также The Washington Post и другие медиа- и развлекательные компании. ElevenLabs заявляет, что пользователи создали аудиоконтент, эквивалентный более чем 100 годам аудиозаписей, а сотрудники 41% компаний из списка Fortune 500 используют их платформу.
Споры и этические проблемы
Несмотря на свой успех, ElevenLabs не обошлась без противоречий. Платформа использовалась в злонамеренных целях, позволяя людям клонировать голоса и распространять вредоносный контент, включая угрозы насилия и разжигание ненависти. В ответ ElevenLabs предприняла шаги по выявлению злоупотребляющих пользователей и внедрила инструменты для обнаружения речи, созданной с помощью их платформы. Кроме того, компания планирует сотрудничать с партнерами по распространению, чтобы сделать этот инструмент доступным на сторонних платформах.
Стартап также столкнулся с критикой со стороны актеров озвучивания, которые утверждают, что ElevenLabs использует образцы их голосов без согласия, что потенциально может привести к продвижению контента, который они не одобряют. Некоторые из них подверглись травле с использованием клонированных голосов. В индустрии озвучивания также растет обеспокоенность по поводу потенциального вытеснения актеров-людей голосами, сгенерированными искусственным интеллектом, особенно на низкооплачиваемых должностях начального уровня.
Решение и конкуренты ElevenLabs
Для решения этих проблем ElevenLabs запустила торговую площадку для голосов, позволяющую пользователям создавать, проверять и делиться голосами. Создатели получают вознаграждение, когда другие используют их голоса, что дает им контроль над доступностью и условиями вознаграждения. Однако вместо денежного вознаграждения создатели в настоящее время получают кредиты для оплаты премиум-услуг ElevenLabs.
Стартап сталкивается с конкуренцией со стороны других игроков на рынке синтеза голоса, включая Papercup, Deepdub, Acapela, Respeecher и Voice.ai, а также со стороны таких признанных технологических гигантов, как Amazon, Microsoft и Google. ElevenLabs планирует продолжить свой рост, расширив свою команду с 40 до 100 сотрудников к концу года, с намерением оказать значительное влияние на быстрорастущий рынок синтеза голоса.
Компания ElevenLabs, получившая впечатляющие 80 миллионов долларов инвестиций и оцененная более чем в 1 миллиард долларов, становится доминирующей силой в индустрии клонирования голоса с помощью искусственного интеллекта. Хотя её инновации получили высокую оценку иtracклиентов высшего уровня, стартап также столкнулся с критикой и этическими проблемами, связанными с неправомерным использованием её технологии и потенциальной угрозой для профессии актёра озвучивания. Тем не менее, ElevenLabs активно решает эти проблемы, улучшая меры безопасности и создавая торговую площадку для создателей голосов. В условиях конкуренции со стороны других развивающихся стартапов и технологических гигантов, ElevenLabs остаётся приверженной развитию рынка синтетических голосов, одновременно преодолевая сложности этических вопросов и отраслевых потрясений.

