A IA não pode prosperar sem o conhecimento humano – a compensação para os criadores originais é imprescindível

- O treinamento de modelos de IA requer grandes conjuntos de dados, e é melhor que eles sejam baseados em conhecimento humano.
- Jornais e organizações de pesquisa, juntamente com portais da web, investem seus recursos na coleta e publicação de informações.
- A compensação para os criadores originais do conteúdo é imprescindível, visto que agora as empresas de IA estão licenciando conteúdo de outras empresas.
O treinamento de modelos de IA exige enormes quantidades de conjuntos de dados, e sua capacidade de produzir bons resultados depende diretamente dos dados que o sistema recebe. Informação não é gratuita, e estamos falando aqui de muitos direitos de propriedade intelectual.
Mas as empresas de IA não pensam dessa forma; elas consideram todo o conhecimento produzido por gerações de escritores como algo garantido; seu conceito de uso justo também é diferente de como era percebido inicialmente; e elas não gostam de pagar aos criadores do conteúdo que serviu de modelo para suas capacidades atuais.
Roubo de conhecimento humano
Há muito trabalho árduo e dedicação envolvidos na produção do conteúdo que vemos em jornais, revistas, livros, arquivos online e artigos de pesquisa, mas isso não seria possível sem escritores, editores, pesquisadores e editores que o disponibilizam ao público de diferentes formas.
Esse reconhecimento e conhecimento, conquistados com tanto esforço, não deveriam ser explorados livremente por uma empresa, como aconteceu em determinado momento.
“Informações que estão disponíveis publicamente na internet.”
Fonte: OpenAI.
Sim, é isso que a OpenAI responde quando questionada sobre o conteúdo usado para treinar seus sistemas de IA, juntamente com as informações licenciadas de terceiros e as informações fornecidas por seus usuários e treinadores humanos.
Falando em conteúdo licenciado, as empresas estão buscando essa informação agora, mas não temos nenhuma informação sobre se a OpenAI licenciou alguma informação de um fornecedor antes de lançar seu modelo GPT inicial. O modelo deve ter sido treinado com materiais protegidos por direitos autorais que não eram de uso livre para fins comerciais.

Compensação para criadores originais
Até um ano atrás, a maior parte do texto escrito online ou offline era produzida por humanos. Apesar das iscas de cliques, conteúdo de baixa qualidade também era encontrado, mas pelo menos era criado por humanos que entendiam a psique humana e o processo de pensamento, e aplicativos de IA generativa eram construídos com base nessas informações.
Mas hoje, as empresas enfrentam um novo problema no treinamento de seus modelos de IA: o conteúdo gerado por máquinas que predomina na internet e que, de forma alguma, pode ser considerado conteúdo de qualidade. Esse tipo de conteúdo sobrecarrega os recursos disponíveis para o treinamento de modelos de IA, já que eles não conseguem produzir resultados de qualidade quando treinados com conteúdo irrelevante e prolixo, que é como esses modelos geralmente geram conteúdo. A produção de conteúdo por IA, também chamada de canibalismo ou clonagem de IA, é um processo frequentemente descrito como tal.
Para evitar que isso aconteça, as empresas de IA precisam limitar seu material de origem apenas a fontes confiáveis, que nada mais são do que jornais, revistas e fóruns públicos que abrigam uma vasta quantidade de conhecimento produzido por humanos. Algumas outras fontes também podem ser consideradas, como mencionado anteriormente, mas essa necessidade e os processos judiciais movidos por jornais os obrigaram a licenciar o conteúdo e a pagar pela exploração que praticavam.
Empresas como o Reddit, um grande fórum público online, também estão considerando licenciar seu conteúdo para empresas de IA. Em um comunicado, afirmaram que preferem negócios a processos judiciais, mas não descartaram a possibilidade de recorrer à justiça caso as negociações comerciais não prosperem. Se você não tem permissão para usar umatracem um vídeo do YouTube, por que uma empresa de IA deveria ter permissão para usá-la no treinamento de seus modelos destinados ao uso comercial?
A questão dos direitos autorais é problemática, visto que empresas de IA os violam constantemente. Por outro lado, a IA não é capaz de coletar notícias por conta própria; é necessário o esforço humano para reunir e confirmar informações em diferentes fontes antes da publicação. Somente após essa confirmação, um modelo de IA pode utilizar essas informações, e não remunerar o trabalho humano nesse caso configura exploração.
Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.
Aviso: As informações fornecidas não constituem aconselhamento de investimento. Cryptopolitannão se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.
CURSO
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)















