Un tribunal fédéral a statué mercredi que l'utilisation par Meta Platforms Inc. de millions de livres, d'articles universitaires et de bandes dessinées protégés par le droit d'auteur pour entraîner ses modèles d'intelligence artificielle Llama relève de l'« utilisation équitable ».
Il s'agit d'une victoire juridique pour les entreprises technologiques développant l'IA générative. La plainte, déposée par un groupe d'écrivains dont Ta-Nehisi Coates et Richard Kadrey, accusait le géant des médias sociaux et de l'IA, valorisé à 1 400 milliards de dollars, d'avoir utilisé illégalement un immense catalogue de contenus web sans autorisation.
Ces œuvres ont été obtenues par le biais d'archives telles que LibGen — une bibliothèque parallèle qui héberge du contenu sans accorder de droits d'éditeur.
Cependant, le juge de district américain Vince Chhabria, à San Francisco, s'est rangé du côté de Meta, concluant que les auteurs n'avaient pas présenté les arguments juridiques appropriés pour étayer leurs affirmations.
« Cette décision ne signifie pas que l’utilisation par Meta de documents protégés par le droit d’auteur pour l’entraînement de ses modèles de langage est légale », a précisé Chhabria dans sa décision. « Elle signifie seulement que les plaignants ont présenté des arguments erronés et n’ont pas étayé leurs arguments. »
L'argument de Meta concernant l'utilisation transformatrice fait pencher la balance en sa faveur
Meta a fait valoir que l'entraînement de son modèle d'IA constituait une utilisation transformatrice – un principe fondamental de l'usage loyal en vertu du droit d'auteur américain – et que la manière dont elle avait acquis les données était sans importance. Le tribunal a reconnu que le caractère transformateur de la technologie et l'absence d'arguments convaincants de la part des plaignants avaient fait pencher la balance en faveur de Meta.
Cette décision intervient quelques jours seulement après une autre victoire retentissante pour une entreprise d'IA : Anthropic, le créateur des modèles de langage Claude, a obtenu une décision favorable après avoir démontré qu'elle avait entraîné ses modèles sur des livres physiques .
Un juge fédéral de San Francisco a déclaré qu'Anthropic avait fait un « usage équitable » des livres des écrivains Andrea Bartz, Charles Graeber et Kirk Wallace Johnson pour entraîner son modèle de langage étendu Claude (LLM).
Le juge William Alsup a comparé l'utilisation des livres par le modèle anthropologique à celle d'un « lecteur aspirant à devenir écrivain » qui utilise les œuvres « non pas pour les reproduire ou les remplacer », mais pour « prendre un virage à 180 degrés et créer quelque chose de différent ».
Alsup a toutefois ajouté que la copie et le stockage par Anthropic de plus de 7 millions de livres piratés dans une bibliothèque centrale constituaient une violation des droits d'auteur et ne relevaient pas de l'usage loyal, même si la société a par la suite acquis des millions d'ouvrages imprimés. Le juge a ordonné la tenue d'un procès en décembre afin de déterminer le montant des dommages et intérêts dus par Anthropic pour cette infraction.
Alsup a souligné que le fait qu'Anthropic ait par la suite acheté un exemplaire d'un livre volé sur Internet ne l'exonère pas de sa responsabilité. Cela pourrait toutefois avoir une incidence sur le montant des dommages-intérêts légaux.
La loi américaine sur le droit d'auteur stipule que la violation délibérée du droit d'auteur peut entraîner des dommages-intérêts pouvant atteindre 150 000 $ (110 000 £) par œuvre.
Le débat sur le droit d'auteur a exacerbé les tensions entre les entreprises d'IA et les industries créatives, car les modèles d'IA générative — qui alimentent des outils comme ChatGPT — s'appuient sur d'immenses ensembles de données pour apprendre et produire des réponses. Une grande partie de ces données d'entraînement contient des éléments protégés par le droit d'auteur, ce qui suscite des inquiétudes chez les auteurs, les éditeurs et les artistes quant à leur utilisation non autorisée.
Cette décision marque un tournant dans les batailles juridiques autour du droit d'auteur de l'IA
Bien que l'affaire Meta ait été saluée comme une victoire pour les géants de la tech, le juge Chhabria a laissé entendre que des pistes juridiques plus convaincantes pourraient être explorées dans de futures affaires. Il a notamment souligné que les argumentstronpertinents se concentreraient sur la dilution du marché – la menace que représentent pour les auteurs les contenus générés par l'IA, susceptibles de saturer les marchés de livres, de musique et d'œuvres d'art créés par des machines.
« On peut inciter des modèles d'IA générative à produire ces résultats en un temps et avec une créativité infimes », a-t-il averti. « Cela pourraitmaticréduire l'intérêt des êtres humains à créer de manière traditionnelle. »
Meta et les avocats des plaignants n'ont pas encore commenté la décision. Celle-ci aura probablement des répercussions sur les nombreux procès intentés par des créateurs contre des entreprises spécialisées en IA, tandis que le système juridique continue de s'interroger sur l'application du droit d'auteur à l'ère de l'intelligence artificielle.

