O CEO do Reddit, Steve Huffman, insistiu que a plataforma de mídia social continuará a impedir que empresas de IA, incluindo a Microsoft, extraiam dados de seu site até que sejam pagas e tenham uma palavra a dizer sobre como o conteúdo é usado. Ele disse que o Reddit não comprometerá o uso não licenciado de seus dados para treinar modelos de IA, de acordo com The Verge.
Nos últimos meses, o Reddit fez alterações em sua política na tentativa de evitar que os desenvolvedores de IA descartem dados de usuários, postagens e comunidades sem consentimento ou pagamento. Desde então, a empresa concluiu um acordo de US$ 60 milhões com o Google, permitindo que a gigante da tecnologia usasse seu conteúdo. O Reddit fez um acordo com a OpenAI, fabricante do ChatGPT, em maio.
Microsoft lucra com conteúdo gratuito do Reddit
No entanto, a Microsoft continuou a usar o conteúdo do Reddit para construir os recursos de IA em seu mecanismo de busca Bing sem permissão, alegou Huffman. O CEO do Reddit acusou a Microsoft de lucrar com o conteúdo de sua empresa. Ele disse que a Microsoft colheu os dados gratuitamente, mas os vendeu para entidades de IA por meio da API do Bing para obter lucro.
Eventualmente, o Reddit bloqueou o acesso da Microsoft aos dados de seus usuários – o que significa que o Bing não poderia mais exibir o conteúdo do Reddit em seus resultados de pesquisa. O Reddit aproveita o Protocolo de Exclusão de Robôs, ou robots.txt, uma ferramenta usada por sites para identificar dent da web que acessam o site e impedir o uso não autorizado de seus dados. entrevista recente ao The Verge, Huffman declarou:
“A Microsoft, a Anthropic e a Perplexity agiram como se todo o conteúdo da Internet fosse gratuito para uso. Essa é a sua posição real.”
Huffman revelou que as três empresas – Microsoft, Anthropic e Perplexity – e outras empresas menores de IA se recusaram a negociar o pagamento pela extração do conteúdo do Reddit. As entidades normalmente argumentam que os dados são informações publicamente disponíveis e podem ser usados de acordo com os princípios de uso justo. A Salesforce defendeu anteriormente o uso de conteúdo do YouTube pelos mesmos motivos. A Apple também disse que treinou sua IA com base em dados disponíveis publicamente.
“Sem esses acordos, não temos qualquer palavra a dizer ou conhecimento sobre como nossos dados são exibidos e para que são usados”, disse Huffman. “[Isso] nos colocou agora em uma posição de bloquear pessoas que não estavam dispostas a aceitar como gostaríamos que nossos dados fossem usados ou não.”
Chefe da Microsoft diz que conteúdo da web é ‘freeware’
Um porta-voz da Microsoft disse que a empresa “respeita” o protocolo robot.txt e parou de rastrear o Reddit em 1º de julho. Enquanto isso, Mustafa Suleyman, CEO da Microsoft AI, apareceu recentemente na imprensa descrevendo o conteúdo do Reddit como freeware.
“…com relação ao conteúdo que já está na web aberta, otracsocial desse conteúdo desde os anos 90 é que seja de uso justo”, detalhou. “Qualquer um pode copiar, recriar com ele, reproduzir com ele. Isso foi freeware, se você quiser. Esse tem sido o entendimento.”
As leis de direitos autorais dos EUA permitem a reutilização de conteúdo publicado. O site de direitos autorais do governo dos Estados Unidos afirma que é permitido usar partes limitadas de uma obra, incluindo citações, para fins como comentários, críticas, reportagens de notícias e relatórios acadêmicos, já que todos se enquadram na doutrina do uso justo. No entanto, os motores de busca não são obrigados a compensar os editores.
O fio de diferença -chave ajuda as marcas de criptografia a romper e dominar as manchetes rapidamente