인공지능 기반 음성 복제 분야의 선구적인 스타트업인 일레븐랩스(ElevenLabs)가 최근 시리즈 B 투자 라운드에서 8천만 달러라는 놀라운 금액을 유치했습니다. 앤드리슨 호로위츠(Andreessen Horowitz), 전 깃허브(GitHub) CEO 냇 프리드먼(Nat Friedman), 그리고 기업가 다니엘 그로스(Daniel Gross) 등 유명 투자자들이 공동으로 주도한 이번 투자를 통해 일레븐랩스는 기업 가치가 10억 달러를 돌파하며 유니콘 기업으로 등극했습니다. 일레븐랩스는 이번 투자금을 바탕으로 제품 개선, 인프라 및 팀 확장, 인공지능 연구 개발, 그리고 인공지능 기술의 책임감 있고 윤리적인 개발을 위한 안전 조치 강화에 더욱 집중할 계획입니다.
AI 기반 음성 복제
2022년 구글의 머신러닝 엔지니어 출신인 피오트르 답코프스키와 팔란티어의 배포 전략가 출신인 마티 스타니셰프스키가 설립한 일레븐랩스는 인공지능(AI) 기반의 합성 음성 생성 및 편집 도구를 개발하는 것을 목표로 삼았습니다. 이들은 어색하게 더빙된 미국 영화에서 영감을 얻어 AI를 통해 더빙 과정을 획기적으로 개선할 수 있을 것이라는 믿음을 갖게 되었습니다. 일레븐랩스는 약 1년 전 브라우저 기반 음성 생성 앱을 출시하여 사용자가 억양, 감정, 리듬 및 기타 음성 특성을 조절하여 실제와 같은 목소리를 만들 수 있도록 했습니다.
ElevenLabs는 무료 및 유료 옵션을 모두 제공합니다. 무료 사용자는 텍스트를 입력하고 기본 음성으로 읽어주는 녹음 파일을 받을 수 있으며, 유료 고객은 음성 샘플을 업로드하여 ElevenLabs의 음성 복제 기술을 활용해 고유한 스타일을 만들 수 있습니다. 나아가, ElevenLabs는 오디오북, 영화 및 TV 프로그램 더빙, 게임 및 마케팅 활동을 위한 캐릭터 음성 생성 등 다양한 분야로 서비스를 확장하고 있습니다.
혁신과 고객
ElevenLabs의 주목할 만한 혁신 중 하나는 화자의 목소리, 운율, 억양을 그대로 유지하면서 배경 소음을 제거하도록 설계된 "음성 대 음성" 도구입니다. 또한 음성을 원본 자료와 번역 및 동기화하여 영화나 TV 프로그램 제작에 특히 유용합니다. 향후 개발 예정인 기능으로는 텍스트 변환 및 번역 도구를 포함한 더빙 스튜디오 워크플로우와 ElevenLabs의 음성을 사용하여 웹페이지와 텍스트를 읽어주는 구독 기반 모바일 앱이 있습니다.
이 회사의 혁신적인 기술은 Cities: Skylines 2와 Stellaris 같은 게임으로 유명한 게임 개발사 Paradox Interactive, 워싱턴 포스트를 비롯한 여러 미디어 및 엔터테인먼트 기업을 고객으로trac들였습니다. ElevenLabs는 사용자들이 100년이 넘는 오디오 콘텐츠 분량에 해당하는 오디오 콘텐츠를 제작했으며, 포춘 500대 기업의 41%가 자사 플랫폼을 활용하고 있다고 자랑합니다.
논란과 윤리적 문제
성공적인 플랫폼으로 자리매김했지만, ElevenLabs는 논란에서 자유롭지 못했습니다. 일부 사용자는 이 플랫폼을 악용하여 목소리를 복제하고 폭력 위협 및 혐오 발언을 포함한 유해 콘텐츠를 유포했습니다. 이에 ElevenLabs는 악용 사용자를 퇴출하고 플랫폼을 이용해 제작된 콘텐츠를 탐지하는 도구를 개발했습니다. 또한, 이러한 도구를 제3자 플랫폼에서도 사용할 수 있도록 배포 파트너와 협력할 계획입니다.
이 스타트업은 성우들로부터도 비판을 받고 있는데, 일부 성우들은 ElevenLabs가 동의 없이 성우들의 목소리 샘플을 사용하여 자신들이 지지하지 않는 콘텐츠를 홍보할 가능성이 있다고 주장합니다. 또한, 복제된 목소리를 이용한 괴롭힘을 당한 성우들도 있습니다. 성우 업계에서는 특히 저임금의 초급 직종에서 AI 생성 음성이 인간 성우를 대체할 가능성에 대한 우려가 커지고 있습니다.
ElevenLabs의 솔루션 및 공모전
이러한 우려를 해소하기 위해 ElevenLabs는 사용자들이 음성을 제작, 검증 및 공유할 수 있는 음성 마켓플레이스를 도입했습니다. 제작자는 다른 사용자가 자신의 음성을 사용할 때 보상을 받으며, 이를 통해 음성 사용 가능 여부와 보상 조건을 직접 관리할 수 있습니다. 다만, 현재는 금전적 보상 대신 ElevenLabs의 프리미엄 서비스 이용에 사용할 수 있는 크레딧을 지급하고 있습니다.
이 스타트업은 Papercup, Deepdub, Acapela, Respeecher, Voice.ai 등 합성 음성 분야의 다른 업체들과 경쟁하고 있으며, Amazon, Microsoft, Google과 같은 기존 기술 대기업들과도 경쟁하고 있습니다. ElevenLabs는 성장을 지속하여 연말까지 직원 수를 40명에서 100명으로 늘릴 계획이며, 빠르게 성장하는 합성 음성 시장에서 의미 있는 영향력을 행사하겠다는 목표를 가지고 있습니다.
8천만 달러라는 놀라운 투자 유치와 10억 달러가 넘는 기업 가치를 자랑하는 일레븐랩스(ElevenLabs)는 AI 기반 음성 복제 산업에서 강력한 선두주자로 떠오르고 있습니다. 혁신적인 기술로 호평을 받으며 최고 수준의 고객들을trac했지만, 동시에 기술 오용 및 성우 업계에 미칠 수 있는 잠재적 위협에 대한 비판과 윤리적 문제에도 직면해 있습니다. 일레븐랩스는 이러한 문제에 적극적으로 대응하기 위해 안전장치를 강화하고 음성 제작자를 위한 마켓플레이스를 구축하고 있습니다. 다른 신흥 스타트업 및 거대 기술 기업들과의 경쟁 속에서도, 일레븐랩스는 윤리적 문제와 업계 변화에 대한 심도 있는 이해를 바탕으로 합성 음성 시장을 발전시키는 데 전념하고 있습니다.

