Des documents judiciaires révèlent que des membres de l'équipe de Meta ont discuté de l'utilisation de contenu protégé par le droit d'auteur pour l'entraînement de l'IA. Ces documents montrent que des employés de Meta ont discuté de l'utilisation de contenu protégé par le droit d'auteur pour l'entraînement de l'IA. L'équipe de Meta a discuté de l'utilisation de contenu protégé par le droit d'auteur pour l'entraînement de l'IA. Ces documents judiciaires révèlent que des documents judiciaires montrent que des employés de Meta ont discuté de l'utilisation de contenu protégé

- Des documents judiciaires ont montré que des employés de Meta ont discuté de l'utilisation de contenu protégé par le droit d'auteur pour entraîner ses modèles d'intelligence artificielle (IA).
- Des discussions internes ont également révélé comment l'entreprise aurait pu utiliser des contenus juridiquement problématiques pour entraîner ses modèles d'IA.
- Les documents judiciaires ont révélé d'autres infractions, les plaignants ayant modifié leur plainte.
Des documents judiciaires ont révélé que des employés de Meta ont évoqué l'utilisation de contenus protégés par le droit d'auteur pour entraîner leurs modèles d'intelligence artificielle. Selon des documents judiciaires récents, la plupart de ces discussions portaient sur des contenus obtenus par des moyens douteux.
Ces documents ont été rendus publics par les plaignants dans l'affaire Kadrey contre Meta, l'une des nombreuses affaires de droit d'auteur relatives à l'IA qui ont été portées devant les tribunaux américains. Selon Meta, l'utilisation d'œuvres protégées par le droit d'auteur, notamment des livres, pour entraîner ses modèles relève de l'exception de « fair use ». Cependant, les plaignants, menés par Sarah Silverman et Ta-Nehisi Coates, contestent les affirmations de l'entreprise.
D'après des documents précédemment soumis, Mark Zuckerberg, PDG de Meta, a autorisé l'équipe d'IA de l'entreprise à utiliser du contenu protégé par le droit d'auteur pour entraîner ses modèles. Ces documents indiquent également que l'entreprise a interrompu ses négociations concernant les licences de données avec les éditeurs de livres.
Meta utiliserait du contenu protégé par le droit d'auteur pour entraîner ses modèles d'IA
Selon de nouveaux documents déposés auprès du tribunal, des conversations internes entre employés de Meta ont clairement montré comment l'entreprise aurait utilisé des données protégées par le droit d'auteur pour entraîner ses modèles d'IA, notamment la plupart des modèles de la famille Llama.
L'une des conversations impliquait Melanie Kambadur, cadre supérieure chez Meta et responsable de l'équipe de recherche Llama. Elle y évoquait l'entraînement des modèles d'IA sur des contenus non justifiés juridiquement.
« Mon avis serait (dans l’esprit de “demander pardon plutôt que la permission”) : nous essayons d’acquérir les livres et de remonter l’information aux dirigeants afin qu’ils prennent la décision », a déclaré Xavier Martinet, ingénieur de recherche chez Meta, dans une conversation datée de février 2023, selon les documents déposés. « C’est pourquoi ils ont créé cette organisation d’IA générale : pour que nous soyons moins réticents au risque », a-t-il ajouté.
Martinet a indiqué que l'entreprise pourrait simplement acheter des livres numériques au prix public pour constituer son ensemble de données d'entraînement, au lieu de conclure des accords de licence avec différents éditeurs. Tandis qu'un autre employé mettait en garde contre l'utilisation de tels contenus et ses conséquences juridiques, Martinet a fait remarquer que d'autres entreprises utilisaient probablement aussi des livres piratés pour la formation de leurs équipes.
Au cours de cette même conversation, Kambadur a mentionné que l'entreprise était en pourparlers avec certaines plateformes en vue d'obtenir des licences. Il a toutefois précisé que, même si l'utilisation de données publiques nécessiterait des autorisations, les juristes de l'entreprise étaient moins réticents qu'auparavant. « La différence, c'est que nous avons maintenant plus de moyens financiers, plus d'avocats, un soutien accru en développement commercial, la possibilité d' tracles procédures et de faire remonter les problèmes, et nos juristes sont un peu moins réticents à accorder des autorisations », a déclaré Kambadur.
Les employés discutent de l'utilisation de Libgen
D'après les documents déposés, une autre conversation professionnelle révèle que Kambadur évoquait l'utilisation de Libgen, un site web agrégateur fournissant des liens vers du contenu protégé par le droit d'auteur, comme source de données que Meta pourrait exploiter sous licence. Libgen a fait l'objet de nombreuses poursuites judiciaires et a été contraint de cesser ses activités pour violation de droits d'auteur.
Alors qu'un autre participant à la conversation publiait une image accompagnée du commentaire « Non, Libgen n'est pas légal », il semblait que certains dirigeants estimaient que ne pas utiliser Libgen pourrait nuire à la compétitivité de l'entreprise dans la course à l'IA. Dans un courriel adressé par Sony Theakanath, directeur de la gestion des produits chez Meta, à Joelle Pineau, vice-présidente de Meta AI, il soulignait l'importance de Libgen pour atteindre les performances de pointe dans tous les domaines.
Theakanath a également évoqué plusieurs moyens pour l'entreprise de réduire son exposition juridique, notamment la suppression des données signalées comme volées ou piratées et la non-divulgation publique d'autres utilisations. « Nous ne divulguerons pas l'utilisation des jeux de données Libgen pour l'entraînement », a-t-il déclaré. Concrètement, cela signifie que l'entreprise examinera d'abord les fichiers Libgen pour vérifier la présence d'œuvres volées ou piratées.
Des documents judiciaires révèlent d'autres infractions
Dans une discussion de travail, Kambadur a également suggéré que l'équipe Meta AI ajuste les modèles pour « éviter les invites IP risquées », ce qui configurera les modèles pour qu'ils refusent de donner des réponses aux utilisateurs essayant de connaître les livres électroniques sur lesquels les modèles ont été entraînés.
Les documents déposés ont également révélé d'autres détails, notamment que Meta aurait utilisé de Reddit pour entraîner son modèle à imiter le comportement d'une application tierce appelée Pushshift. Reddit a indiqué dans un communiqué d'avril 2023 qu'il commencerait à facturer aux entreprises d'IA l'accès aux données nécessaires à l'entraînement de leurs modèles.
Dans cette affaire, les plaignants ont modifié leur plainte à plusieurs reprises depuis le début de la procédure en 2023. La plainte a été déposée auprès du tribunal de district des États-Unis pour le district nord de la Californie, à San Francisco. Dans leur dernier amendement, les plaignants affirment que Meta a comparé des livres piratés avec des ouvrages protégés par le droit d'auteur afin de déterminer s'il serait judicieux de conclure un de licence . De son côté, Meta considère cette affaire comme un enjeu juridique majeur et a décidé d'intégrer deux avocats spécialisés dans les plaidoiries devant la Cour suprême à son équipe de défense.
Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter.
Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustrondentdentdentdentdentdentdentdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.
LES
- Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
- Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
- Stratégies d'investissement peu connues utilisées par les professionnels
- Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)














