ÚLTIMAS NOTÍCIAS
SELECIONADO PARA VOCÊ
SEMANALMENTE
MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

O novo modelo da DeepSeek supera o carro-chefe em um salto de IA

PorNélio IreneNélio Irene
Tempo de leitura: 3 minutos
  • O DeepSeek lançou uma nova atualização V3.1 com maior eficiência de processamento.
  • A nova atualização da startup supera a RI em diversos testes de desempenho.
  • Analistas de mercado esperavam que a DeepSeek lançasse o sucessor do R1 no início deste ano.

A startup chinesa DeepSeek apresentou uma nova atualização, alegando que ela supera a consagrada versão R1 em todos os principais benchmarks. Em uma publicação no WeChat na quinta-feira, a empresa de IA confirmou que a nova versão do modelo, V3.1, oferece respostas mais rápidas às consultas e sinaliza sua entrada no desenvolvimento de agentes de IA.

A DeepSeek acrescentou que o modelo suporta uma arquitetura de raciocínio híbrida, com modos de pensamento e não pensamento, capacidades aprimoradas do agente etronno uso de ferramentas e na execução de tarefas.

O DeepSeek oferece um botão "Pensamento Profundo" para alternar entre os modos

Até o momento, o aplicativo e o site oficiais do DeepSeek já foram atualizados para a versão 3.1, permitindo que os usuários alternem entre os modos de pensamento e não pensamento por meio do botão “Deep Thinking”, de forma semelhante ao funcionamento dos modelos híbridos da Anthropic, como o Opus e o Sonnet.

Segundo informações, o modelo V3.1 também apresenta melhor desempenho em benchmarks como SWE e Terminal-Bench, além de maior eficiência de raciocínio, em comparação com o R1. Ademais, de acordo com a Artificial Analysis, o modelo alcançou 60 pontos em seu índice de inteligência no modo de raciocínio, um pouco acima dos 59 pontos obtidos pelo R1. Ainda assim, a arquitetura subjacente permanece a mesma, com 671 bilhões de parâmetros totais e 37 bilhões de parâmetros ativos.

Apesar de apresentar maior eficiência, o novo modelo também utiliza um número ligeiramente menor de tokens que o R1 no modo de raciocínio. No entanto, ele fica um pouco atrás do modelo mais recente e do modelo de raciocínio de código aberto da OpenAI, o GPT-OSS, em termos de desempenho. Além disso, ele não permite a chamada de funções no modo de raciocínio, o que é considerado uma grande limitação em fluxos de trabalho com agentes.

A startup anunciou o novo modelo na terça-feira, embora, naquele momento, ele estivesse disponível apenas na Hugging Face. Um comunicado separado acrescentou que a versão foi adaptada para funcionar com chips de IA de última geração fabricados na China. 

A empresa acaba de apresentar um novo plano de preços para a versão atualizada V3. O plano aumenta algumas taxas, elimina os descontos noturnos e reduz os custos em determinados aplicativos, com vigência a partir de 6 de setembro.

A DeepSeek definiu o preço de sua API de entrada em US$ 0,07 por milhão de tokens para acertos de cache e US$ 0,56 para erros de cache, com tokens de saída a US$ 1,68 por milhão. As taxas são consideravelmente mais baixas que as da concorrência: o Gemini 2.5 Pro custa US$ 10 por milhão de tokens de saída (US$ 15 para solicitações mais longas), o GPT-5 da OpenAI também custa US$ 10 e o Claude Opus 4.1 da Anthropic chega a custar US$ 75.

Analistas previam que a DeepSeek lançaria o sucessor do R1 no início deste ano

A DeepSeek causou grande impacto no Vale do Silício com o lançamento, em janeiro, do seu modelo de IA R1, de baixo custo e alto desempenho. Desde então, o modelo se mantém na vanguarda do crescente desenvolvimento de IA na China, desafiando empresas americanas como a OpenAI.

Observadores do mercado, no entanto, ainda aguardam o sucessor do R1, um possível modelo R2, que muitos esperavam que fosse lançado no início deste ano. Reportagens locais sugerem que o atraso no lançamento se deve à insistência do fundador, Liang Wenfeng, em aperfeiçoar o modelo. Ao mesmo tempo, ele também administra sua lucrativa empresa de gestão de ativos, a High-Flyer Asset Management. 

Conforme relatado anteriormente pela Cryptopolitan, a DeepSeek adiou o lançamento de seu modelo de IA R2 após enfrentar problemas técnicos persistentes com os processadores Ascend da Huawei. Após o sucesso do modelo R1 em janeiro, a DeepSeek foi incentivada pelas autoridades chinesas a adotar chips da Huawei em vez dos produtos da Nvidia, fabricados nos EUA. No entanto, a empresa encontrou problemas significativos durante a fase de treinamento do modelo R2.

Fontes familiarizadas com o assunto disseram que a DeepSeek teve que usar chips da Nvidia para treinamento, enquanto utilizou processadores Ascend da Huawei apenas para inferência. Especialistas do setor observam que os chips chineses, incluindo os da Huawei, frequentemente ficam atrás da Nvidia em conectividade entre chips, suporte de software e estabilidade geral.

A Huawei enviou engenheiros aos escritórios da DeepSeek para ajudar na adaptação do modelo. Mesmo assim, a startup não conseguiu concluir um treinamento bem-sucedido no hardware Ascend, apesar da assistência presencial. Originalmente previsto para maio, o lançamento do modelo R2 foi adiado devido a esses desafios de hardware.

Embora alguns veículos de comunicação chineses especulem que o novo modelo possa ser lançado nas próximas semanas, o fundador da DeepSeek, Liang Wenfeng, expressou frustração interna com o progresso do projeto, instando a equipe a dedicar o tempo necessário para desenvolver um modelo que preserve a vantagem competitiva da empresa.

Entretanto, gigantes do setor como Alibaba e Tencent continuam lançando atualizações rapidamente, com os modelos Qwen da Alibabatracumtronparticularmente fiel.

As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrondentdentdentdentdentdentdentdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

MAIS… NOTÍCIAS
INTENSIVO AVANÇADAS
CURSO