Tekniska framsteg banar väg för artificiell intelligens (AI) att ersätta mänskliga röstskådespelare i ljudböckers berättande. När AI går in i förlagsbranschen, väcker proffs inom området oro för framtiden för sina karriärer. Medan AI-genererade röster har tagit sig in på plattformar som Google Play och Apple Books, betonar experter att replikeringen av mänskliga berättare av AI-berättare fortfarande är långt ifrån perfekt.
Den växande ljudboksbranschen
Ljudbokssektorn inom förlagsbranschen upplever exponentiell tillväxt, med försäljningen som förutspås öka med 26 % årligen från 2022 till 2030. Forskning utförd av Wordsrated indikerar att ljudboksmarknaden beräknas nå svindlande 35 miljarder dollar år 2030.
Mitt i denna blomstrande industri blir röstskådespelare allt mer försiktiga med AI:s potential att klona sina röster. Vissa proffs undviker till och med jobbmöjligheter som kan leda till att deras röster replikeras av AI. Röstskådespelaren Brad Ziffer, till exempel, sa att han vägrar att delta i voiceover-arbete som innebär att skapa AI-modeller från hans röst, och väljer att skydda sig själv genom att hålla sig borta från sådana projekt.
Aktuell implementering av AI i ljudböcker
AI-genererade röster har redan hittat sin väg till ljudboksplattformar som Google Play och Apple Books. Apple introducerade diskret ljudböcker som berättas av AI-röster som heter "Jackson" och "Madison" i sin bokapp. På samma sätt erbjuder Google Play ett automatiskt berättaralternativ för ljudböcker, så länge förlagen äger rättigheterna till innehållet.
Även om AI-tekniken har gjort betydande framsteg, är det fortfarande en betydande utmaning att sömlöst replikera människors sätt att tala. Unika aspekter som känslomässiga uttryck, kadens och intonation som mänskliga berättare tar till bordet är svåra att replikera med nuvarande AI-kapacitet. Voiceover marknadsplatschef David Ciccarelli betonar att människor utmärker sig i timing, vare sig det är genom välplacerade pauser eller perfekt utförd komisk timing, som AI kämpar för att reproducera.
Skillnad mellan mänskliga och AI-berättare
I ett test utfört av Insider med hjälp av fem ljudboksutdrag, var det möjligt att korrekt identifiera dent klipp som berättades av människor och vilka som var verk av Apples AI-genererade röster. Även om AI-rösterna inte var helt avskräckande, var det uppenbart dent de saknade de nyanserade egenskaperna hos mänskligt berättande och mycket mer. Robotljudande AI-genererade röster kan ibland vara nervösa. Här är några förslag på förbättringar .
För att AI-röster ska bli mer mänskliga måste de antingen replikera dessa nyanser, eller så anpassar vi oss till att lyssna på alltför perfekt klingande tal. Mänskliga talfel kan beskrivas som naturliga inkonsekvenser och oregelbundenheter i talmönster som gör mänskliga röster unika och autentiska. Dessa ofullkomligheter bidrar till talets övergripande karaktär och uttrycksförmåga.
Framtiden för AI-berättare i ljudböcker
Många röstskådespelare delar en försiktig syn på AI:s roll i branschen. Samtidigt som de erkänner dess potential uttrycker de oro över dess potential för övergrepp. För närvarande tror mänskliga röstskådespelare att AI-algoritmerna som används för att syntetisera röster inte är tillräckligt avancerade för att fullt ut återskapa den mänskliga röstens krångligheter och nyanser.
När ljudboksbranschen fortsätter att frodas ställer närvaron av AI-berättare utmaningar för röstskådespelare. Även om AI-tekniken har tagit framsteg, har den ännu inte matchat de unika egenskaper som människor ger till berättande, såsom timing, känslomässigt djup och individualiserat uttryck. Även om vissa röstskådespelare fortfarande är oroliga för användningen av AI, erkänner de också teknikens potential för att förbättra området. När branschen utvecklas kommer relationen mellan AI och röstskådespelare i ljudbokssektorn utan tvekan att fortsätta att utvecklas.