Reddit a intenté une action en justice contre la start-up d'IA Anthropic, l'accusant d'avoir utilisé les données de sa plateforme pour entraîner des modèles d'IA, notamment le chatbot Claude.
La plainte, déposée mercredi dernier devant la Cour supérieure de Californie à San Francisco, allègue qu'Anthropic a enfreint le contrat d'utilisation de Reddit et s'est livrée à des « actes commerciaux illégaux et déloyaux » en collectant des données sans accord de licence.
Les documents judiciaires commençaient par un commentaire de Reddit qualifiant Anthropic d'entreprise d'IA « tardive » qui « se présente comme le chevalier blanc de l'industrie de l'IA » et affirmant qu'« elle est tout sauf cela »
Reddiot accuse Anthropic de vol de données
Selon Reddit, Anthropic a accédé à son contenu plus de 100 000 fois depuis juillet 2024, même après avoir affirmé avoir cessé le crawling en mai 2024.
Reddit a déclaré que, contrairement à ce qu'affirment ses supports marketing, Anthropic ne se soucie ni de ses règles ni de ses utilisateurs. « L'entreprise s'estime en droit de s'approprier n'importe quel contenu et de l'utiliser à sa guise, en toute impunité », indique le document.
Reddit affirme avoir établi des règles dictant la manière dont ses données peuvent être utilisées, et précise qu'elles sont clairement consignées dans le contrat d'utilisation.
« Bien que Reddit ait toujours considéré que la communauté devait être ouverte à tous les êtres humains en quête de connexion et de communauté, elle n'a jamais permis que sa plateforme et les innombrables communautés qui y trouvent refuge soient appropriées par des acteurs commerciaux cherchant à créer des entreprises valant des milliards de dollars sans rien offrir en retour à Reddit et à ses utilisateurs », indique la plainte.
L'entreprise réclame des dommages et intérêts, la restitution des sommes dues et une injonction pour empêcher toute utilisation non autorisée ultérieure.
Cependant, Anthropic a contesté ces allégations et, dans un communiqué envoyé par courriel, a déclaré qu'elle se défendrait « vigoureusement ».
Le partenariat avec OpenAI établit undent quant aux attentes de Reddit vis-à-vis des entreprises d'IA
Depuis le lancement de ChatGPT d'OpenAI fin 2022, Reddit est à l'avant-garde des droits d'utilisation des données. Son site regorge d'informations générées par les utilisateurs sur des centaines de milliers de sujets et a été une source majeure d'entraînement pour de grands modèles d'IA, dont Claude d'Anthropic.
Cependant, Reddit a conclu un partenariat avec OpenAI, annoncé en mai, qui lui permet d'entraîner ses modèles d'IA sur le contenu de Reddit. L'entreprise a un accord similaire avec Google, mais aucun avec Anthropic.
Dans la plainte récemment déposée, Reddit a souligné comment « d'autres géants du secteur de l'IA comprennent et respectent les règles de Reddit », citant OpenAI et Google comme des entreprises « autorisées à utiliser le contenu public de Reddit, mais seulement après avoir accepté des "conditions de licence" protégeant la vie privée des utilisateurs ».
La plainte déposée par Reddit contre Anthropic souligne qu'Anthropic a contourné ces accords en collectant des données sans autorisation, ce qui, selon les informations, compromet son modèle économique et la confiance des utilisateurs.
L'expérience de Reddit avec OpenAI a peut-être accru sa sensibilité à l'utilisation abusive des données, ce qui explique les poursuites judiciaires engagées par la plateforme pour protéger son marché des licences de données. Son accord avec OpenAI se caractérise par un contrat de licence formel aux termes clairs, qui semble désormais faire jurisprudence dent à la collaboration de Reddit avec les entreprises spécialisées en intelligence artificielle.

