ÚLTIMAS NOTÍCIAS

ao vivo AO VIVO: Bitcoin despenca para US$ 58.000 enquanto criptomoedas eliminam US$ 2,4 trilhões em valor de mercado total

Atualizações ao vivo de 24 de junho de 2026
Michael Saylor adota tom defienquanto críticos se acumulam sobre o prejuízo de US$ 14 bilhões em BTC da Strategy

Notícias de 22 minutos atrás
A ZachXBT levanta uma preocupação com a liquidez, já que usuários da AscendEX relatam problemas com saques

Notícias de 33 minutos atrás
A SpaceX mira o mercado de telecomunicações de US$ 1,6 trilhão

51 minutos atrás Tecnologia

SELECIONADO PARA VOCÊ

A SpaceX mira o mercado de telecomunicações de US$ 1,6 trilhão

51 minutos atrás Tecnologia
O financiamento para agentes de IA ultrapassou US$ 2,9 bilhões, com o número de negócios chegando a 50

Notícias de 4 horas atrás
A venda massiva de equipamentos de fotônica de silício divide o setor de IA, com a Serenity apoiando a SIVE e a AAOI

7 horas atrás Tecnologia

SEMANALMENTE

MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

A IA não pode prosperar sem o conhecimento humano – a compensação para os criadores originais é imprescindível

Por

Aamir Sheikh

Tempo de leitura: 3 minutos - 3 de maio de 2024

O treinamento de modelos de IA requer grandes conjuntos de dados, e é melhor que eles sejam baseados em conhecimento humano.
Jornais e organizações de pesquisa, juntamente com portais da web, investem seus recursos na coleta e publicação de informações.
A compensação para os criadores originais do conteúdo é imprescindível, visto que agora as empresas de IA estão licenciando conteúdo de outras empresas.

O treinamento de modelos de IA exige enormes quantidades de conjuntos de dados, e sua capacidade de produzir bons resultados depende diretamente dos dados que o sistema recebe. Informação não é gratuita, e estamos falando aqui de muitos direitos de propriedade intelectual.

Mas as empresas de IA não pensam dessa forma; elas consideram todo o conhecimento produzido por gerações de escritores como algo garantido; seu conceito de uso justo também é diferente de como era percebido inicialmente; e elas não gostam de pagar aos criadores do conteúdo que serviu de modelo para suas capacidades atuais.

Roubo de conhecimento humano

Há muito trabalho árduo e dedicação envolvidos na produção do conteúdo que vemos em jornais, revistas, livros, arquivos online e artigos de pesquisa, mas isso não seria possível sem escritores, editores, pesquisadores e editores que o disponibilizam ao público de diferentes formas.

Esse reconhecimento e conhecimento, conquistados com tanto esforço, não deveriam ser explorados livremente por uma empresa, como aconteceu em determinado momento.

“Informações que estão disponíveis publicamente na internet.”
Fonte: OpenAI.

Sim, é isso que a OpenAI responde quando questionada sobre o conteúdo usado para treinar seus sistemas de IA, juntamente com as informações licenciadas de terceiros e as informações fornecidas por seus usuários e treinadores humanos.

Falando em conteúdo licenciado, as empresas estão buscando essa informação agora, mas não temos nenhuma informação sobre se a OpenAI licenciou alguma informação de um fornecedor antes de lançar seu modelo GPT inicial. O modelo deve ter sido treinado com materiais protegidos por direitos autorais que não eram de uso livre para fins comerciais.

Compensação para criadores originais

Até um ano atrás, a maior parte do texto escrito online ou offline era produzida por humanos. Apesar das iscas de cliques, conteúdo de baixa qualidade também era encontrado, mas pelo menos era criado por humanos que entendiam a psique humana e o processo de pensamento, e aplicativos de IA generativa eram construídos com base nessas informações.

Mas hoje, as empresas enfrentam um novo problema no treinamento de seus modelos de IA: o conteúdo gerado por máquinas que predomina na internet e que, de forma alguma, pode ser considerado conteúdo de qualidade. Esse tipo de conteúdo sobrecarrega os recursos disponíveis para o treinamento de modelos de IA, já que eles não conseguem produzir resultados de qualidade quando treinados com conteúdo irrelevante e prolixo, que é como esses modelos geralmente geram conteúdo. A produção de conteúdo por IA, também chamada de canibalismo ou clonagem de IA, é um processo frequentemente descrito como tal.

Para evitar que isso aconteça, as empresas de IA precisam limitar seu material de origem apenas a fontes confiáveis, que nada mais são do que jornais, revistas e fóruns públicos que abrigam uma vasta quantidade de conhecimento produzido por humanos. Algumas outras fontes também podem ser consideradas, como mencionado anteriormente, mas essa necessidade e os processos judiciais movidos por jornais os obrigaram a licenciar o conteúdo e a pagar pela exploração que praticavam.

Empresas como o Reddit, um grande fórum público online, também estão considerando licenciar seu conteúdo para empresas de IA. Em um comunicado, afirmaram que preferem negócios a processos judiciais, mas não descartaram a possibilidade de recorrer à justiça caso as negociações comerciais não prosperem. Se você não tem permissão para usar umatracem um vídeo do YouTube, por que uma empresa de IA deveria ter permissão para usá-la no treinamento de seus modelos destinados ao uso comercial?

A questão dos direitos autorais é problemática, visto que empresas de IA os violam constantemente. Por outro lado, a IA não é capaz de coletar notícias por conta própria; é necessário o esforço humano para reunir e confirmar informações em diferentes fontes antes da publicação. Somente após essa confirmação, um modelo de IA pode utilizar essas informações, e não remunerar o trabalho humano nesse caso configura exploração.

As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.

Compartilhe este artigo

Aviso: As informações fornecidas não constituem aconselhamento de investimento. Cryptopolitannão se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Aamir Sheikh

Aamir é um jornalista de tecnologia com quase seis anos de experiência nos setores de criptomoedas e tecnologia. Ele se formou na MAJ University com um MBA em Finanças e Marketing. Atualmente, trabalha na Cryptopolitan, onde reporta sobre os últimos acontecimentos nos mercados de criptomoedas e previsões de preços.

ÍNDICE

1. Roubo de conhecimento humano

2. Compensação para criadores originais

Compartilhe este artigo

MAIS… NOTÍCIAS

MOSTRAR TUDO

5 aplicações engenhosas do ChatGPT e o que você deve fazer a respeito

Há 3 anos, John Palmer, da área de tecnologia

93% dos líderes empresariais preferem soluções baseadas em IA para a gestão da sustentabilidade da marca, segundo a Reuters

Há 3 anos, John Palmer, da área de tecnologia

Eis como Macron apoia o ecossistema de IA vibrante e produtivo da França

Há 3 anos, Tech Glory Kaburu

A Bloomberg estima que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032

3 anos atrás, Aamir Sheikh, da área de tecnologia

O que é Base? A rede Ethereum de camada 2 lançada pela Coinbase

21 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Dogecoin vs. Bitcoin: Principais Diferenças Técnicas

20 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é TVL (Valor Total Bloqueado) em criptomoedas?

14 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Como ler um white paper de criptomoedas?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Ripple vs. XRP vs. XRP Ledger: Qual a diferença?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é uma carteira multisig em criptomoedas?

10 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes

CURSO INTENSIVO DE CRIPTOMOEDAS AVANÇADAS

Quais criptomoedas podem te fazer ganhar dinheiro?
Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
Estratégias de investimento pouco conhecidas que os profissionais utilizam
Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)