El director ejecutivo de Reddit, Steve Huffman, ha insistido en que la plataforma de redes sociales seguirá impidiendo que las empresas de inteligencia artificial, incluida Microsoft, recopilen datos en su sitio hasta que se les pague y tengan voz y voto en cómo se utiliza el contenido. Dijo que Reddit no comprometerá el uso sin licencia de sus datos para entrenar modelos de IA, según The Verge.
En los últimos meses, Reddit ha realizado cambios en su política en un intento de evitar que los desarrolladores de IA eliminen los datos de sus usuarios, publicaciones y comunidades sin consentimiento ni pago. Desde entonces, la compañía ha cerrado un acuerdo por valor de 60 millones de con Google, lo que permite al gigante tecnológico utilizar su contenido. Reddit llegó a un acuerdo con OpenAI, creador de ChatGPT, en mayo.
Microsoft se beneficia del contenido gratuito de Reddit
Sin embargo, Microsoft ha seguido utilizando el contenido de Reddit para crear funciones de inteligencia artificial en su motor de búsqueda Bing sin permiso, alegó Huffman. El director ejecutivo de Reddit acusó a Microsoft de sacar provecho del contenido de su empresa. Dijo que Microsoft extrajo los datos de forma gratuita pero los vendió a entidades de inteligencia artificial a través de la API de Bing para obtener ganancias.
Finalmente, Reddit impidió que Microsoft accediera a los datos de sus usuarios, lo que significa que Bing ya no podía mostrar el contenido de Reddit en sus resultados de búsqueda. Reddit aprovecha el Protocolo de exclusión de robots, o robots.txt, una herramienta utilizada por los sitios web para identificar dent rastreadores web que acceden al sitio y evitar el uso no autorizado de sus datos. En una entrevista con The Verge, Huffman declaró:
“Hemos hecho que Microsoft, Anthropic y Perplexity actúen como si todo el contenido de Internet fuera de uso gratuito. Esa es su verdadera posición”.
Huffman reveló que las tres empresas (Microsoft, Anthropic y Perplexity) y otras empresas de inteligencia artificial más pequeñas se han negado a negociar el pago por eliminar el contenido de Reddit. Las entidades suelen argumentar que los datos son información disponible públicamente y pueden utilizarse según los principios de uso justo. Salesforce defendió anteriormente su uso del contenido de YouTube por los mismos motivos. Apple también ha dicho que entrenó su IA con datos disponibles públicamente.
"Sin estos acuerdos, no tenemos voz ni conocimiento sobre cómo se muestran nuestros datos y para qué se utilizan", dijo Huffman. "[Esto] nos ha puesto ahora en una posición de bloquear a las personas que no han estado dispuestas a aceptar cómo nos gustaría que se usaran o no nuestros datos".
El jefe de Microsoft dice que el contenido web es "freeware"
Un portavoz de Microsoft dijo que la empresa "respeta" el protocolo robot.txt y dejó de rastrear Reddit el 1 de julio. Mientras tanto, Mustafa Suleyman, director ejecutivo de Microsoft AI, apareció recientemente en la prensa describiendo el contenido de Reddit como software gratuito.
“…con respecto al contenido que ya está en la web abierta, eltracsocial de ese contenido desde los años 90 ha sido que es de uso legítimo”, detalló. “Cualquiera puede copiarlo, recrearlo, reproducirlo. Ha sido software gratuito, por así decirlo. Ese ha sido el entendimiento”.
Las leyes de derechos de autor de EE. UU. permiten la reutilización del contenido publicado. El sitio web de derechos de autor del gobierno de los Estados Unidos dice que está permitido utilizar partes limitadas de una obra, incluidas citas, para fines tales como comentarios, críticas, informes de noticias e informes académicos, ya que todos ellos caen bajo la doctrina del uso legítimo. Sin embargo, los motores de búsqueda no están obligados a compensar a los editores.
Tus noticias de criptografía merecen atención: Key Difference Wire te pone en más de 250 sitios superiores