Reddit hat Perplexity AI verklagt, weil das Unternehmen trotz vorheriger Warnungen, die Inhalte der Plattform nicht zu scrapen, weiterhin Reddit-Inhalte zum Trainieren seines KI-Modells verwendet hat.
Da KI-Systeme zunehmend auf öffentlich verfügbare Online-Inhalte angewiesen sind, um trainiert zu werden und Antworten zu generieren, versuchen Unternehmen wie Reddit, klare Grenzen zwischen „öffentlichen“ und „proprietären“ Daten zu ziehen.
Reddits Falle deckt mutmaßlichen Datendiebstahl auf
Reddit hat Klage gegen Perplexity, ein KI-Unternehmen mit einem Wert von 20 Milliarden US-Dollar, eingereicht. Dem Unternehmen wird vorgeworfen, illegal Daten über seine Plattform gesammelt zu haben. Laut Gerichtsakten, die am Mittwoch vor einem Bundesgericht in Manhattan eingereicht wurden, habe Perplexity Anweisungen, keine Inhalte zu extrahieren, ignoriert und weiterhin Reddit-Daten zur Generierung von KI-Antworten verwendet.
Die Klage besagt, dass Reddit Perplexity die Datenerhebung ausdrücklich untersagt hatte, die „Antwortmaschine“ des KI-Unternehmens aber dennoch Ergebnisse mit Reddit-Inhalten lieferte. „Der Anstieg war somatic , dass ein Außenstehender vermutete, er sei auf einen Lizenzvertrag zwischen Perplexity und Reddit zurückzuführen“, heißt es in der Klage. „Tatsächlich besteht jedoch keine Lizenzvereinbarung zwischen Perplexity und Reddit.“
Um seinen Verdacht zu beweisen, entwickelte Reddit einen cleveren digitalen Test. Es erstellte einen „Fangbeitrag“, der nur über die Google-Suchmaschine gefunden werden konnte. Google hat einen gültigen Lizenzvertrag mit Reddit, sodass Unternehmen ohne einen solchen Vertrag keinen Zugriff auf den Beitrag hätten haben dürfen.
Das Unternehmen bezeichnete es als das Online-Äquivalent einer „markierten Rechnung“. Wenn das System von Perplexity den Inhalt dieses versteckten Beitrags reproduzieren würde, wüsste Reddit, dass es seine Sicherheitsvorkehrungen umgangen hatte, möglicherweise durch das Abrufen von Daten über die Suchergebnisse von Google, die sogenannten SERPs.
Innerhalb weniger Stunden tauchte der vermeintlich private Testbeitrag in den Antworten auf, die vom KI-Tool von Perplexity generiert wurden.
„Die einzige Möglichkeit für Perplexity, an diese Reddit-Inhalte zu gelangen und sie dann in seiner ‚Antwortmaschine‘ zu verwenden, besteht darin, dass es und/oder seine Mitbeklagten Google-Suchergebnisse ausgelesen haben“, heißt es in der Klage.
Reddit nannte in der Klage drei Daten-Scraping-Unternehmen, Oxylabs UAB, AWM Proxy und SerpApi. Ihnen wird vorgeworfen, Perplexity dabei geholfen zu haben, sich unbefugten Zugriff auf Reddit-Beiträge zu verschaffen oder Reddit-Daten an Perplexity verkauft zu haben.
Reddit wies die Vorwürfe zurück
die Vorwürfe von Reddit zurückgewiesen . Unternehmenssprecher Jesse Dwyer erklärte, Perplexity werde „Bedrohungen gegen Transparenz und das öffentliche Interesse nicht tolerieren“. In einem Reddit-Beitrag nach Einreichung der Klage hieß es außerdem, Perplexity trainiere „keine KI-Modelle mit Inhalten“.
Auch Vertreter der anderen in der Klage genannten Unternehmen gaben Stellungnahmen ab. Ein Sprecher von SerpApi erklärte, das Unternehmen werde sich vor Gericht „energisch verteidigen“. Denas Grybauskas, Chief Governance and Strategy Officer von Oxylabs, sagte, sein Unternehmen sei „schockiert und enttäuscht“ und fügte hinzu, Oxylabs sei „seit jeher ein Pionier und Branchenführer im Bereich der öffentlichen Datenerfassung und werde es auch weiterhin sein“
Im August gab Cloudflare, ein Internetinfrastrukturunternehmen, bekannt, einen ähnlichen Test durchgeführt zu haben, um zu überprüfen, ob Perplexity die Regeln für Web-Crawling einhält. Cloudflare erklärte, Seiten mit einem Code versehen zu haben, der den Bots von Perplexity den Zugriff untersagte. Dennoch stellte sich heraus, dass die Crawler des KI-Unternehmens die gesperrten Seiten besuchten.
Cloudflare-CEO Matthew Prince sorgte für Schlagzeilen, indem er das Verhalten von Perplexity mit dem von „nordkoreanischen Hackern“ verglich
Manche vermeintlich „seriöse“ KI-Unternehmen verhalten sich eher wie nordkoreanische Hacker. Es ist an der Zeit, sie beim Namen zu nennen, anzuprangern und sie endgültig zu blockieren. https://t.co/vqMzGRHZPf
— Matthew Prince 🌥 (@eastdakota) 4. August 2025
„Manche vermeintlich ‚seriöse‘ KI-Unternehmen verhalten sich eher wie nordkoreanische Hacker“, schrieb Prince auf X. „Es ist an der Zeit, sie beim Namen zu nennen, anzuprangern und sie endgültig zu blockieren.“ Reddit zitierte Princes Äußerungen in seiner Klage.

