Reddit afirma que Perplexity fue descubierto con las manos en la masa recopilando datos

Por

Hannah Collymore

3 minutos de lectura 26 de octubre de 2025

Acceso prioritario al navegador Comet AI de Perplexity como beneficio para los usuarios de PayPal y Venmo

Reddit ha demandado a Perplexity AI por extraer contenido de Reddit en secreto a pesar de estar bloqueado.
Reddit tendió una “trampa” digital que expuso el supuesto uso que Perplexity AI hacía de los resultados de Google para eludir restricciones.
Perplexity y sus socios de datos niegan cualquier irregularidad y prometen defenderse en los tribunales.

Reddit ha demandado a Perplexity AI por seguir usando el contenido de Reddit para entrenar su modelo de IA después de advertencias previas de no extraer el contenido de la plataforma.

A medida que los sistemas de IA dependen cada vez más de contenido en línea disponible públicamente para entrenarse y generar respuestas, empresas como Reddit están tratando de trazar límites firmes sobre lo que se considera datos “públicos” y “privados”.

La trampa de Reddit expone un presunto robo de datos

Reddit ha demandado a Perplexity, una empresa de inteligencia artificial de 20 mil millones de dólares, acusándola de recopilar datos ilegalmente a través de su plataforma. Según documentos judiciales presentados el miércoles en un tribunal federal de Manhattan, Reddit afirmó que Perplexity ignoró las instrucciones de no extraer su contenido y continuó utilizando los datos de Reddit para generar respuestas de inteligencia artificial.

La denuncia afirma que Reddit había impedido explícitamente que Perplexity recopilara sus datos, pero el motor de respuestas de la empresa de inteligencia artificial seguía generando resultados con contenido de Reddit. «El aumento fue tanmatic que un observador externo planteó la hipótesis de que se debía a que Perplexity había firmado un acuerdo de licencia con Reddit», afirma la demanda. «En realidad, no existe ninguna licencia entre Perplexity y Reddit»

Para demostrar su sospecha, Reddit diseñó una ingeniosa prueba digital. Creó una publicación "trampa" que solo podía ser encontrada por el motor de búsqueda de Google. Google tiene un acuerdo legítimo de licencia de contenido con Reddit, por lo que cualquier empresa sin dicho acuerdo no debería haber podido acceder a la publicación.

La empresa lo describió como el equivalente en línea de una "factura marcada". Si el sistema de Perplexity reprodujera el contenido de esa publicación oculta, Reddit sabría que había burlado sus medidas de seguridad, posiblemente extrayendo datos de los resultados de búsqueda de Google, conocidos como SERP.

En cuestión de horas, la publicación de prueba supuestamente privada comenzó a aparecer en las respuestas generadas por la herramienta de inteligencia artificial de Perplexity.

“La única forma en que Perplexity pudo haber obtenido ese contenido de Reddit y luego haberlo usado en su 'motor de respuestas' es si ella y/o sus coacusados extrajeron los SERP de Google”, afirma la demanda.

Reddit demandó a tres empresas de extracción de datos: Oxylabs UAB, AWM Proxy y SerpApi. Las acusó de ayudar a Perplexity a obtener acceso no autorizado a las publicaciones de Reddit o de venderle los datos de Reddit.

Las acusaciones de Reddit fueron negadas

Perplexity ha rechazado las acusaciones. El portavoz de la compañía, Jesse Dwyer, declaró que Perplexity “no tolerará amenazas contra la transparencia y el interés público”. La compañía también afirmó en una publicación de Reddit tras la presentación de la demanda que “no entrena modelos de IA con contenido”.

Representantes de las demás empresas mencionadas en la demanda también emitieron declaraciones. Un portavoz de SerpApi afirmó que planea defenderse enérgicamente en los tribunales. El director de gobernanza y estrategia de Oxylabs, Denas Grybauskas, declaró que su empresa estaba conmocionada y decepcionada, y añadió que Oxylabs siempre ha sido y seguirá siendo pionera y líder del sector en la recopilación de datos públicos

En agosto, Cloudflare, una empresa de infraestructura de internet, reveló que había realizado una prueba similar para comprobar si Perplexity cumplía las normas de rastreo web. Cloudflare afirmó haber creado páginas marcadas con un código que indicaba a los bots de Perplexity que no accedieran a ellas, pero aun así detectó que los rastreadores de la empresa de inteligencia artificial visitaban las páginas restringidas.

El director ejecutivo de Cloudflare, Matthew Prince, fue noticia al comparar el comportamiento de Perplexity con el de los “hackers norcoreanos”

Algunas empresas de IA supuestamente "de buena reputación" actúan más como hackers norcoreanos. Es hora de denunciarlas, avergonzarlas públicamente y bloquearlas definitivamente. https://t.co/vqMzGRHZPf

— Matthew Prince 🌥 (@eastdakota) 4 de agosto de 2025

“Algunas empresas de inteligencia artificial supuestamente 'con buena reputación' actúan más como hackers norcoreanos”, escribió Prince en X. “Es hora de denunciarlos, avergonzarlos y bloquearlos por completo”. La demanda de Reddit citó las declaraciones de Prince como parte de su argumento.

Las mentes más brillantes del mundo de las criptomonedas ya leen nuestro boletín. ¿Te apuntas? ¡ Únete!

Perplejidad Reddit

Comparte este artículo

Hannah Collymore

Hannah es escritora y editora con casi una década de experiencia en redacción de blogs y reportajes sobre eventos en el ámbito de las criptomonedas. En Cryptopolitan, colabora en la sección de noticias, informando y analizando las últimas novedades en DeFi, RWA, regulación de criptomonedas, IA y tecnologías de vanguardia. Se graduó en Administración de Empresas por la Universidad de Arcadia.

ÍNDICE

1. La trampa de Reddit expone un presunto robo de datos

2. Las acusaciones de Reddit fueron negadas

Comparte este artículo