DERNIÈRES NOUVELLES

en direct La Réserve fédérale maintient ses taux d'intérêt inchangés lors de la première réunion de Kevin Warsh

Mises à jour en direct il y a 9 minutes
en direct Bitcoin atteint 67 000 dollars, propulsant les marchés vers des sommets historiques suite à l'accord de paix entre Trump et l'Iran

Mises à jour en direct du 15 juin 2026
Frontier double son fonds de capture du carbone à 1,8 milliard de dollars grâce au soutien de nouveaux géants de la tech

Il y a 53 minutes - Technologie
Le nouveau partenaire de Kalshi permet aux employeurs tracles prévisions de marché du personnel

Actualités d'il y a 1 heure

SÉLECTIONNÉ POUR VOUS

HEBDOMADAIRE

RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

Des documents judiciaires révèlent que des membres de l'équipe de Meta ont discuté de l'utilisation de contenu protégé par le droit d'auteur pour l'entraînement de l'IA. Ces documents montrent que des employés de Meta ont discuté de l'utilisation de contenu protégé par le droit d'auteur pour l'entraînement de l'IA. L'équipe de Meta a discuté de l'utilisation de contenu protégé par le droit d'auteur pour l'entraînement de l'IA. Ces documents judiciaires révèlent que des documents judiciaires montrent que des employés de Meta ont discuté de l'utilisation de contenu protégé

Par

Owotunse Adebayo

3 minutes de lecture - 22 février 2025

Des documents judiciaires révèlent que des membres de l'équipe de Meta ont discuté de l'utilisation de contenu protégé par le droit d'auteur pour l'entraînement de l'IA. Ces documents montrent que des employés de Meta ont discuté de l'utilisation de contenu protégé par le droit d'auteur pour l'entraînement de l'IA. L'équipe de Meta a discuté de l'utilisation de contenu protégé par le droit d'auteur pour l'entraînement de l'IA. Ces documents judiciaires révèlent que des documents judiciaires montrent que des employés de Meta ont discuté de l'utilisation de contenu protégé

Des documents judiciaires ont montré que des employés de Meta ont discuté de l'utilisation de contenu protégé par le droit d'auteur pour entraîner ses modèles d'intelligence artificielle (IA).
Des discussions internes ont également révélé comment l'entreprise aurait pu utiliser des contenus juridiquement problématiques pour entraîner ses modèles d'IA.
Les documents judiciaires ont révélé d'autres infractions, les plaignants ayant modifié leur plainte.

Des documents judiciaires ont révélé que des employés de Meta ont évoqué l'utilisation de contenus protégés par le droit d'auteur pour entraîner leurs modèles d'intelligence artificielle. Selon des documents judiciaires récents, la plupart de ces discussions portaient sur des contenus obtenus par des moyens douteux.

Ces documents ont été rendus publics par les plaignants dans l'affaire Kadrey contre Meta, l'une des nombreuses affaires de droit d'auteur relatives à l'IA qui ont été portées devant les tribunaux américains. Selon Meta, l'utilisation d'œuvres protégées par le droit d'auteur, notamment des livres, pour entraîner ses modèles relève de l'exception de « fair use ». Cependant, les plaignants, menés par Sarah Silverman et Ta-Nehisi Coates, contestent les affirmations de l'entreprise.

D'après des documents précédemment soumis, Mark Zuckerberg, PDG de Meta, a autorisé l'équipe d'IA de l'entreprise à utiliser du contenu protégé par le droit d'auteur pour entraîner ses modèles. Ces documents indiquent également que l'entreprise a interrompu ses négociations concernant les licences de données avec les éditeurs de livres.

Meta utiliserait du contenu protégé par le droit d'auteur pour entraîner ses modèles d'IA

Selon de nouveaux documents déposés auprès du tribunal, des conversations internes entre employés de Meta ont clairement montré comment l'entreprise aurait utilisé des données protégées par le droit d'auteur pour entraîner ses modèles d'IA, notamment la plupart des modèles de la famille Llama.

L'une des conversations impliquait Melanie Kambadur, cadre supérieure chez Meta et responsable de l'équipe de recherche Llama. Elle y évoquait l'entraînement des modèles d'IA sur des contenus non justifiés juridiquement.

« Mon avis serait (dans l’esprit de “demander pardon plutôt que la permission”) : nous essayons d’acquérir les livres et de remonter l’information aux dirigeants afin qu’ils prennent la décision », a déclaré Xavier Martinet, ingénieur de recherche chez Meta, dans une conversation datée de février 2023, selon les documents déposés. « C’est pourquoi ils ont créé cette organisation d’IA générale : pour que nous soyons moins réticents au risque », a-t-il ajouté.

Martinet a indiqué que l'entreprise pourrait simplement acheter des livres numériques au prix public pour constituer son ensemble de données d'entraînement, au lieu de conclure des accords de licence avec différents éditeurs. Tandis qu'un autre employé mettait en garde contre l'utilisation de tels contenus et ses conséquences juridiques, Martinet a fait remarquer que d'autres entreprises utilisaient probablement aussi des livres piratés pour la formation de leurs équipes.

Au cours de cette même conversation, Kambadur a mentionné que l'entreprise était en pourparlers avec certaines plateformes en vue d'obtenir des licences. Il a toutefois précisé que, même si l'utilisation de données publiques nécessiterait des autorisations, les juristes de l'entreprise étaient moins réticents qu'auparavant. « La différence, c'est que nous avons maintenant plus de moyens financiers, plus d'avocats, un soutien accru en développement commercial, la possibilité d' tracles procédures et de faire remonter les problèmes, et nos juristes sont un peu moins réticents à accorder des autorisations », a déclaré Kambadur.

Les employés discutent de l'utilisation de Libgen

D'après les documents déposés, une autre conversation professionnelle révèle que Kambadur évoquait l'utilisation de Libgen, un site web agrégateur fournissant des liens vers du contenu protégé par le droit d'auteur, comme source de données que Meta pourrait exploiter sous licence. Libgen a fait l'objet de nombreuses poursuites judiciaires et a été contraint de cesser ses activités pour violation de droits d'auteur.

Alors qu'un autre participant à la conversation publiait une image accompagnée du commentaire « Non, Libgen n'est pas légal », il semblait que certains dirigeants estimaient que ne pas utiliser Libgen pourrait nuire à la compétitivité de l'entreprise dans la course à l'IA. Dans un courriel adressé par Sony Theakanath, directeur de la gestion des produits chez Meta, à Joelle Pineau, vice-présidente de Meta AI, il soulignait l'importance de Libgen pour atteindre les performances de pointe dans tous les domaines.

Theakanath a également évoqué plusieurs moyens pour l'entreprise de réduire son exposition juridique, notamment la suppression des données signalées comme volées ou piratées et la non-divulgation publique d'autres utilisations. « Nous ne divulguerons pas l'utilisation des jeux de données Libgen pour l'entraînement », a-t-il déclaré. Concrètement, cela signifie que l'entreprise examinera d'abord les fichiers Libgen pour vérifier la présence d'œuvres volées ou piratées.

Des documents judiciaires révèlent d'autres infractions

Dans une discussion de travail, Kambadur a également suggéré que l'équipe Meta AI ajuste les modèles pour « éviter les invites IP risquées », ce qui configurera les modèles pour qu'ils refusent de donner des réponses aux utilisateurs essayant de connaître les livres électroniques sur lesquels les modèles ont été entraînés.

Les documents déposés ont également révélé d'autres détails, notamment que Meta aurait utilisé de Reddit pour entraîner son modèle à imiter le comportement d'une application tierce appelée Pushshift. Reddit a indiqué dans un communiqué d'avril 2023 qu'il commencerait à facturer aux entreprises d'IA l'accès aux données nécessaires à l'entraînement de leurs modèles.

Dans cette affaire, les plaignants ont modifié leur plainte à plusieurs reprises depuis le début de la procédure en 2023. La plainte a été déposée auprès du tribunal de district des États-Unis pour le district nord de la Californie, à San Francisco. Dans leur dernier amendement, les plaignants affirment que Meta a comparé des livres piratés avec des ouvrages protégés par le droit d'auteur afin de déterminer s'il serait judicieux de conclure un de licence . De son côté, Meta considère cette affaire comme un enjeu juridique majeur et a décidé d'intégrer deux avocats spécialisés dans les plaidoiries devant la Cour suprême à son équipe de défense.

Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter.

Libgen Meta Pushshift Reddit USD

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustronrecommandons vivement d’effectuer vosdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Owotunse Adebayo

Adebayo est un rédacteur spécialisé dans le secteur des cryptomonnaies depuis quatre ans. Diplômé de l'Université de Lagos en urbanisme et aménagement du territoire, il a travaillé chez Tokenhell et CryptoTicker, où il rédigeait des articles sur l'actualité des cryptomonnaies et de la fintech. Il collabore actuellement avec Cryptopolitan.

TABLE DES MATIÈRES

1. Meta utiliserait du contenu protégé par le droit d'auteur pour entraîner ses modèles d'IA

2. Les employés discutent de l'utilisation de Libgen

3. Des documents judiciaires révèlent d'autres infractions

Partagez cet article

PLUS D'ACTUALITÉS

AFFICHER TOUT

5 applications ingénieuses de ChatGPT et ce que vous devriez en faire

Il y a 3 ans, John Palmer, technicien

93 % des dirigeants d'entreprise privilégient les solutions basées sur l'IA pour la gestion de la durabilité de leur marque (Reuters)

Il y a 3 ans, John Palmer, technicien

Voici comment Macron soutient l'écosystème d'IA dynamique et productif de la France

Il y a 3 ans, Tech Glory Kaburu

Bloomberg estime que le marché de l'IA générative atteindra 1 300 milliards de dollars d'ici 2032

Il y a 3 ans, Tech Aamir Sheikh

Base est-il le réseau Ethereum de couche 2 lancé par Coinbase ?

21 octobre 2025 Apprendre la crypto : Guides pour débutants
Dogecoin contre Bitcoin: Principales différences techniques

20 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce que la TVL (Total Value Locked) en cryptomonnaie ?

14 octobre 2025 Apprendre la crypto : Guides pour débutants
Comment lire un livre blanc sur les cryptomonnaies ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Ripple vs. XRP vs. XRP Ledger : quelle est la différence ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce qu'un portefeuille multisignature dans le monde des cryptomonnaies ?

10 octobre 2025 Apprendre la crypto : Guides pour débutants

COURS ACCÉLÉRÉ SUR LES CRYPTOMONNAIES

Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
Stratégies d'investissement peu connues utilisées par les professionnels
Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)