HarperCollins a annoncé un accord avec ElevenLabs, une société audio d'IA qui crée des livres audio en langues étrangères. Cette collaboration utilisera une technologie de synthèse vocale de pointe pour convertir des livres en audio, revitalisant ainsi la vaste liste de documents sous forme audio.
Technologie IA d'ElevenLabs pour la production de livres audio
La technologie ElevenLabs se concentre sur l'amélioration de l'expérience des livres audio en introduisant des fonctionnalités de lecture qui personnalisent l'expérience d'écoute. ElevenLabs, créé en 2022 par un ancien ingénieur en apprentissage automatique de Google, Piotr Dabkowski, et l'ancien stratège de Palantir, Mati Staniszewski, ElevenLabs a créé un logiciel capable de produire un discours humanisé pour mots, montrant les tons des sentiments, de l'injustice et du rythme du discours.
Cette démonstration fusionne à terme l'acte d'écoute et la création de livres audio, permettant ainsi de produire des livres audio plus efficacement et à moindre coût.
ElevenLabs a créé un outil pour répondre aux besoins des éditeurs et des auteurs non corporatifs. Son interface permet de créer un livre audio toutes les heures.
Des options telles que la personnalisation audio et vocale, l'attribution de textes à des locuteurs spécifiques ou la configuration de pauses qui s'intègrent naturellement dans le processus de narration sont toutes disponibles. De plus, les utilisateurs peuvent garantir la cohésion et l’intégrité contextuelle.
Expansion stratégique sur les marchés mondiaux
Dans l'accord signé par Harper Collins et ElevenLabs, les deux sociétés tentent de répondre à la demande croissante de titres de livres audio qui ne sont pas écrits en anglais et, par conséquent, cet effort vise à élargir la portée du vaste catalogue de HarperCollins.
HarperCollins indique que les livres audio générés par l'IA, un élément qui est déjà devenu sinon principal mais essentiel, continueront d'exister aux côtés de la narration classic par des acteurs humains.
L'utilisation de la technologie de synthèse vocale est envisagée comme une étape supplémentaire qui permettra à l'éditeur de proposer une plus large gamme de livres audio sans compromettre le toucher et la sensation des acteurs vocaux fournis dans les narrations.
Le partenariat prouve que la technologie de l’IA domine de plus en plus le secteur de l’édition, l’intégration de la technologie devenant la solution viable pour améliorer la qualité des traductions et l’efficacité opérationnelle.
Outre le fait qu’il s’agit d’exploiter la puissance de l’IA dans l’accessibilité des contenus, cela donne également un exemple de la manière dont les acteurs de l’industrie peuvent adopter des technologies appropriées qui, à leur tour, évoquent une expérience client passionnante.
L'histoire originale est parue dans TheBookseller