OpenAI et Microsoft font face à une nouvelle plainte de la part de CIR

- Le CIR poursuit OpenAI et Microsoft pour violation des droits d'auteur.
- OpenAI a utilisé 17 849 URL du CIR pour entraîner ses LLM sans demander d'autorisation ni verser de compensation.
- Le CIR réclame des dommages et intérêts pour contrefaçon et violations du DMCA, ce qui pourrait représenter des millions de dollars.
OpenAI et Microsoft font face à une nouvelle plainte du Center for Investigative Reporting (CIR). Le CIR affirme qu'OpenAI a utilisé des contenus publiés sur les sites web Mother Jones et Reveal pour entraîner des versions antérieures de ChatGPT.
À lire également : OpenAI abandonne la voix de ChatGPT après la polémique avec Scarlett Johansson
Le CIR, plaignant, affirme qu'OpenAI a utilisé son contenu sans autorisation ni promesse de compensation. Le CIR, fondé en 1977, gère le magazine américain à but non lucratif Mother Jones et le podcast Reveal.
CIR poursuit OpenAI et Microsoft pour violation de droits d'auteur
Le Center for Investigative Reporting (CIR) a déposé plainte jeudi devant un tribunal fédéral de New York. L'organisation à but non lucratif accuse OpenAI et Microsoft d'avoir utilisé son contenu sans autorisation ni compensation. Le CIR affirme qu'OpenAI a enfreint les lois sur le droit d'auteur en utilisant son contenu pour entraîner ChatGPT.
La PDG du CIR, Monika Bauerlein, a déclaré : « Ce comportement de passager clandestin est non seulement injuste, mais constitue également une violation du droit d’auteur. Le travail des journalistes, au CIR comme ailleurs, est précieux, et OpenAI et Microsoft le savent. »
🚨[Poursuite pour violation de droits d'auteur concernant l'IA] Le Center for Investigative Reporting (à l'origine de @MotherJones et @reveal) poursuit OpenAI et Microsoft pour violation de droits d'auteur. Citations :
« Les accusés ont copié, utilisé, abrégé et affiché le contenu précieux de CIR sans l'autorisation de CIR, et… pic.twitter.com/SeZ0VtDOMY »
– Luiza Jarovsky, PhD (@LuizaJarovsky) 29 juin 2024
Dans sa plainte officielle, le plaignant a mandaté un expert en analyse de données pour analyser la OpenWebText . OpenWebText est une approximation de WebText, un corpus de pages web extraites créé par OpenAI. L'expert a constaté que l'ensemble de données contenait 17 434 URL provenant de Mother Jones et 415 de Reveal. Le nombre d'articles de Mother Jones dans OpenWebText et WebText diffère légèrement car l'extraction des données a été effectuée à des dates différentes.
Le plaignant a déclaré dans sa plainte officielle :
« Lorsqu’ils ont constitué leurs ensembles d’entraînement avec des œuvres journalistiques, les défendeurs avaient le choix : respecter les œuvres journalistiques ou non. Les défendeurs ont choisi la seconde option. »
À lire également : Ilya Sutskever, directeur scientifique d’OpenAI, fait ses adieux
OpenAI a utilisé deux algorithmes, Dragnet et Newspaper, pour constituer la base de données WebText. Dragnet est conçu pour extraire le contenu principal des articles des autres éléments du site web, tels que l'en-tête, le pied de page, le titre, le nom de l'auteur et les mentions de droit d'auteur. Lors de l'analyse du site web de Mother Jones, OpenAI a supprimé tout le contenu de l'en-tête et du pied de page. De plus, le créateur de ChatGPT a supprimé la mention de droit d'auteur et les conditions d'utilisation, conformément à la plainte.
De plus, le plaignant affirme que Microsoft savait que les URL extraites contenaient du contenu journalistique sans noms d'auteurs, titres ni mentions de droit d'auteur, facilitant ainsi la violation du droit d'auteur par Bing AI et ChatGPT.
Le CIR réclame les profits tirés de la contrefaçon auprès d'OpenAI et de Microsoft, ainsi que des dommages et intérêts, qu'ils soient réels ou légaux. Le montant minimum réclamé est de 750 $ par œuvre contrefaite et de 2 500 $ par violation du DMCA.
OpenAI fait face à des poursuites judiciaires de la part d'autres publications
Ce n'est pas la première fois qu'OpenAI est poursuivie pour violation de droits d'auteur. Depuis la sortie de ChatGPT fin 2022, OpenAI et Microsoft ont fait face à de nombreuses plaintes de la part de grands médias comme le New York Times, The Intercept, le New York Daily News et le Chicago Tribune.
À lire également : Des employés affirment qu’OpenAI et Google DeepMind dissimulent des risques liés à l’IA
Parallèlement, plusieurs grands éditeurs et géants d'Internet ont signé des accords de licence avec OpenAI, lui donnant accès à leurs archives. Parmi eux figurent TIME Magazine, News Corp, le Financial Times, Vox Media, l'Associated Press, The Atlantic, Stack Overflow et Reddit.
Reportage Cryptopolitan de Randa Moses
Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter.
Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustrondentdentdentdentdentdentdentdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.
LES
- Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
- Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
- Stratégies d'investissement peu connues utilisées par les professionnels
- Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)















