ÚLTIMAS NOTÍCIAS

ao vivo Bitcoin dispara para US$ 67.000 com o acordo de paz entre Trump e Irã impulsionando os mercados a um alto patamar

Atualizações ao vivo de 15 de junho de 2026
Bitcoin Rodney se declara culpado em esquema de fraude com criptomoedas de US$ 1,8 bilhão

Notícias de 36 minutos atrás
Trace Finance conclui uma rodada de financiamento Série A de US$ 32 milhões para expandir sua infraestrutura de stablecoins na América Latina e na região Ásia-Pacífico

Notícias de 47 minutos atrás
Documentos do mercado privado recebem verificação on-chain enquanto Inveniam e Docugami visam preencher a lacuna de confiança de dados da IA

50 minutos atrás - Opiniões do setor

SELECIONADO PARA VOCÊ

Os EUA investem US$ 500 milhões na SandboxAQ em materiais para chips projetados por IA

2 horas atrás Tecnologia
Xiaohongshu almeja avaliação de US$ 70 bilhões em IPO em Hong Kong

10 horas atrás Tecnologia
A estreia da IA robótica da Alibaba sinaliza a tentativa da China de dominar o mundo físico

19 horas atrás Tecnologia

SEMANALMENTE

MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

Os custos ocultos dos modelos de treinamento de IA

Por

Brenda Kanana

Tempo de leitura: 2 minutos - 24 de agosto de 2024

O desenvolvimento de modelos de IA é caro, custando centenas de milhões devido às necessidades de computação e dados.
Os elevados custos dos dados centralizam o desenvolvimento da IA, levantando preocupações éticas.
Gruposdent trabalham com conjuntos de dados abertos, e novas estratégias, como dados generativos, ainda estão em fase de teste.

A construção e a manutenção de modelos modernos de IA exigem investimentos significativos, que podem ultrapassar centenas de milhões de dólares. Estimativas indicam que esses custos podem chegar a um bilhão de dólares em um futuro próximo.

Esse gasto se deve principalmente ao poder computacional, onde são utilizadas unidades como as GPUs da Nvidia, que podem custar cerca de US$ 30.000 cada e exigir milhares de dólares adicionais para serem eficientes. Pesquisadores afirmaram que a qualidade e a quantidade do conjunto de dados de treinamento usado no desenvolvimento desses modelos são muito importantes.

Líderes do setor revelam custos exorbitantes do desenvolvimento de IA

Segundo James Betker, da OpenAI, o desempenho de um modelo é função dos dados de treinamento, e não do design ou da arquitetura do modelo. Ele afirma que modelos treinados com grandes conjuntos de dados alcançarão os mesmos resultados. Portanto, os dados são a chave para o avanço da tecnologia de IA.

Dario Amodei, CEO da empresa de IA Anthropic AI, compartilhou suas percepções sobre os aspectos financeiros desses desafios no podcast In Good Company. Ele afirmou que o treinamento dos modelos atuais, como o ChatGPT-4, está estimado em cerca de US$ 100 milhões, e o treinamento de modelos futuros pode exigir entre US$ 10 bilhões e US$ 100 bilhões nos próximos anos.

Os modelos generativos de IA, e aqueles criados por grandes empresas, são, em sua essência, modelos estatísticos. Portanto, utilizam muitos exemplos para prever os resultados mais prováveis. Kyle Lo, do Allen Institute for AI (AI2), afirma que o ganho de desempenho pode ser atribuído principalmente aos dados, especialmente quando o ambiente de treinamento é consistente.

A centralização de dados levanta preocupações éticas e de acessibilidade

O alto custo de obtenção de dados de boa qualidade está fazendo com que o desenvolvimento da IA seja privilégio de poucas grandes empresas no mundo desenvolvido. Essa concentração de recursos também é motivo de preocupação quanto à disponibilidade da tecnologia de IA e à possibilidade de uso indevido.

Só a OpenAI já gastou centenas de milhões de dólares em licenças de dados, e a Meta considerou adquirir editoras para obter acesso a dados. O mercado de dados para treinamento de IA deve se expandir, e os corretores de dados provavelmente se beneficiarão dessa oportunidade.

Os problemas surgem de práticas questionáveis de aquisição de dados. De acordo com os relatórios, muitas empresas capturaram grandes volumes de conteúdo sem a autorização dos proprietários desse conteúdo, e algumas empresas coletam dados de diferentes plataformas sem remunerar os usuários. Como relatamos anteriormente, a OpenAI usou seu modelo de transcrição de áudio Whisper para transcrever mais de um milhão de horas de vídeos do YouTube para aprimorar o GPT-4.

Organizações trabalham para criar conjuntos de dados de treinamento de IA de acesso aberto

À medida que a corrida pela aquisição de dados apresenta alguns problemas, são necessários esforços de entidadesdent para disponibilizar conjuntos de dados de treinamento de forma aberta. Algumas organizações, como a EleutherAI e a Hugging Face, estão criando grandes conjuntos de dados que estão disponíveis ao público para o desenvolvimento de IA.

O Wall Street Journal destacou recentemente duas estratégias potenciais para solucionar problemas de aquisição de dados: geração de dados sintéticos e aprendizagem curricular. Os dados sintéticos são criados usando os próprios modelos de IA, enquanto a aprendizagem curricular busca fornecer aos modelos dados de alta qualidade de forma estruturada, para que possam estabelecer conexões mesmo com menos dados. No entanto, ambos os métodos ainda estão em fase de desenvolvimento e sua eficácia ainda não foi comprovada.

Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.

Nvidia OpenAI

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Brenda Kanana

Brenda possui mais de 4 anos de experiência especializada em criptomoedas, inteligência artificial e tecnologias emergentes. Ela trabalhou na Zycrypto, Blockchain Reporter, The Coin Republic e agora, na Cryptopolitan , é sua casa. Sua formação em Sociologia pela Universidade Técnica de Mombasa a mantém em sintonia com o que seus leitores desejam.

ÍNDICE

1. Líderes do setor revelam custos exorbitantes do desenvolvimento de IA

2. A centralização de dados levanta preocupações éticas e de acessibilidade

3. Organizações trabalham para criar conjuntos de dados de treinamento de IA de acesso aberto

Compartilhe este artigo

MAIS… NOTÍCIAS

MOSTRAR TUDO

5 aplicações engenhosas do ChatGPT e o que você deve fazer a respeito

Há 3 anos, John Palmer, da área de tecnologia

93% dos líderes empresariais preferem soluções baseadas em IA para a gestão da sustentabilidade da marca, segundo a Reuters

Há 3 anos, John Palmer, da área de tecnologia

Eis como Macron apoia o ecossistema de IA vibrante e produtivo da França

Há 3 anos, Tech Glory Kaburu

A Bloomberg estima que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032

3 anos atrás, Aamir Sheikh, da área de tecnologia

O que é Base? A rede Ethereum de camada 2 lançada pela Coinbase

21 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Dogecoin vs. Bitcoin: Principais Diferenças Técnicas

20 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é TVL (Valor Total Bloqueado) em criptomoedas?

14 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Como ler um white paper de criptomoedas?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Ripple vs. XRP vs. XRP Ledger: Qual a diferença?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é uma carteira multisig em criptomoedas?

10 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes

CURSO INTENSIVO DE CRIPTOMOEDAS AVANÇADAS

Quais criptomoedas podem te fazer ganhar dinheiro?
Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
Estratégias de investimento pouco conhecidas que os profissionais utilizam
Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)

Os custos ocultos dos modelos de treinamento de IA

Líderes do setor revelam custos exorbitantes do desenvolvimento de IA

A centralização de dados levanta preocupações éticas e de acessibilidade

Organizações trabalham para criar conjuntos de dados de treinamento de IA de acesso aberto

5 aplicações engenhosas do ChatGPT e o que você deve fazer a respeito

93% dos líderes empresariais preferem soluções baseadas em IA para a gestão da sustentabilidade da marca, segundo a Reuters

Eis como Macron apoia o ecossistema de IA vibrante e produtivo da França

A Bloomberg estima que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032

Um briefing conciso.Todos os dias.

Um briefing conciso.
Todos os dias.