DERNIÈRES NOUVELLES
SÉLECTIONNÉ POUR VOUS
HEBDOMADAIRE
RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

OpenAI et Microsoft font face à une nouvelle plainte de la part de CIR

ParRanda MosesRanda Moses
Temps de lecture : 2 minutes
OpenAI et Microsoft font face à une nouvelle plainte du Center for Investigative Reporting
  • Le CIR poursuit OpenAI et Microsoft pour violation des droits d'auteur.
  • OpenAI a utilisé 17 849 URL du CIR pour entraîner ses LLM sans demander d'autorisation ni verser de compensation. 
  • Le CIR réclame des dommages et intérêts pour contrefaçon et violations du DMCA, ce qui pourrait représenter des millions de dollars.

OpenAI et Microsoft font face à une nouvelle plainte du Center for Investigative Reporting (CIR). Le CIR affirme qu'OpenAI a utilisé des contenus publiés sur les sites web Mother Jones et Reveal pour entraîner des versions antérieures de ChatGPT.

À lire également : OpenAI abandonne la voix de ChatGPT après la polémique avec Scarlett Johansson 

Le CIR, plaignant, affirme qu'OpenAI a utilisé son contenu sans autorisation ni promesse de compensation. Le CIR, fondé en 1977, gère le magazine américain à but non lucratif Mother Jones et le podcast Reveal. 

CIR poursuit OpenAI et Microsoft pour violation de droits d'auteur 

Le Center for Investigative Reporting (CIR) a déposé plainte jeudi devant un tribunal fédéral de New York. L'organisation à but non lucratif accuse OpenAI et Microsoft d'avoir utilisé son contenu sans autorisation ni compensation. Le CIR affirme qu'OpenAI a enfreint les lois sur le droit d'auteur en utilisant son contenu pour entraîner ChatGPT.

La PDG du CIR, Monika Bauerlein, a déclaré : « Ce comportement de passager clandestin est non seulement injuste, mais constitue également une violation du droit d’auteur. Le travail des journalistes, au CIR comme ailleurs, est précieux, et OpenAI et Microsoft le savent. »

Dans sa plainte officielle, le plaignant a mandaté un expert en analyse de données pour analyser la OpenWebText . OpenWebText est une approximation de WebText, un corpus de pages web extraites créé par OpenAI. L'expert a constaté que l'ensemble de données contenait 17 434 URL provenant de Mother Jones et 415 de Reveal. Le nombre d'articles de Mother Jones dans OpenWebText et WebText diffère légèrement car l'extraction des données a été effectuée à des dates différentes.

Le plaignant a déclaré dans sa plainte officielle :

« Lorsqu’ils ont constitué leurs ensembles d’entraînement avec des œuvres journalistiques, les défendeurs avaient le choix : respecter les œuvres journalistiques ou non. Les défendeurs ont choisi la seconde option. »

À lire également : Ilya Sutskever, directeur scientifique d’OpenAI, fait ses adieux

OpenAI a utilisé deux algorithmes, Dragnet et Newspaper, pour constituer la base de données WebText. Dragnet est conçu pour extraire le contenu principal des articles des autres éléments du site web, tels que l'en-tête, le pied de page, le titre, le nom de l'auteur et les mentions de droit d'auteur. Lors de l'analyse du site web de Mother Jones, OpenAI a supprimé tout le contenu de l'en-tête et du pied de page. De plus, le créateur de ChatGPT a supprimé la mention de droit d'auteur et les conditions d'utilisation, conformément à la plainte

De plus, le plaignant affirme que Microsoft savait que les URL extraites contenaient du contenu journalistique sans noms d'auteurs, titres ni mentions de droit d'auteur, facilitant ainsi la violation du droit d'auteur par Bing AI et ChatGPT.

Le CIR réclame les profits tirés de la contrefaçon auprès d'OpenAI et de Microsoft, ainsi que des dommages et intérêts, qu'ils soient réels ou légaux. Le montant minimum réclamé est de 750 $ par œuvre contrefaite et de 2 500 $ par violation du DMCA.

OpenAI fait face à des poursuites judiciaires de la part d'autres publications

Ce n'est pas la première fois qu'OpenAI est poursuivie pour violation de droits d'auteur. Depuis la sortie de ChatGPT fin 2022, OpenAI et Microsoft ont fait face à de nombreuses plaintes de la part de grands médias comme le New York Times, The Intercept, le New York Daily News et le Chicago Tribune.

À lire également : Des employés affirment qu’OpenAI et Google DeepMind dissimulent des risques liés à l’IA

Parallèlement, plusieurs grands éditeurs et géants d'Internet ont signé des accords de licence avec OpenAI, lui donnant accès à leurs archives. Parmi eux figurent TIME Magazine, News Corp, le Financial Times, Vox Media, l'Associated Press, The Atlantic, Stack Overflow et Reddit.


Reportage Cryptopolitan de Randa Moses

Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter.

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustrondentdentdentdentdentdentdentdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

PLUS D'ACTUALITÉS
COURS ACCÉLÉRÉ CRYPTOMONNAIES
LES