A DeepSeek lançou a versão R1-0528, uma grande atualização para o modelo de raciocínio R1 da startup chinesa, que havia sido lançado em janeiro. A atualização chegou apenas um mês depois de o Qwen3, do Alibaba Group Holding, ter superado o DeepSeek R1 original no LiveBench, um benchmark online para modelos de inteligência artificial de código aberto.
O modelo R1-0528 atualizado da DeepSeek agora se equipara em desempenho aos principais modelos de IA da OpenAI e do Google. Essa recuperação demonstra a rapidez com que as grandes empresas de tecnologia chinesas e as empresas de tecnologia mais recentes estão se esforçando para aprimorar suas ferramentas de IA.
Em seu comunicado, a DeepSeek afirmou que a versão R1-0528 demonstra melhor raciocínio e habilidades de escrita criativa. A atualização também traz uma capacidade de codificaçãotron. Mais importante ainda, a empresa alega que o modelo agora produz 50% menos "alucinações"
A DeepSeek explicou que as melhorias foram resultado do aumento da capacidade computacional investido durante a fase de pós-treinamento, quando os engenheiros ajustam o modelo após o processo principal de treinamento. Durante essa fase, o objetivo é aumentar a eficiência do modelo, bem como aprimorar sua precisão e segurança.
O R1-0528 agora está classificado logo atrás do o3 e do o4-mini da OpenAI
No LiveCodeBench, que mede o desempenho de modelos de IA, o R1-0528 agora está classificado logo atrás dos modelos o4-mini e o3 da OpenAI.
“A atualização mais recente do DeepSeek é mais precisa em raciocínio, maistronem matemática e código, e está se aproximando de modelos de ponta como Gemini e O3”, disse Adina Yakefu, pesquisadora de IA da Hugging Face.
Ela acrescentou que a nova versão apresenta "melhorias significativas na inferência e na redução de alucinações" e comprova que a startup não está apenas alcançando a concorrência, mas competindo ativamente.
O rápido progresso ocorreu depois que Washington restringiu as exportações de chips avançados e outras tecnologias para a China. Mesmo assim, as empresas chinesas continuam a aprimorar seus sistemas. No início deste mês, a Baidu e a Tencent descreveram maneiras pelas quais estão tornando seus modelos mais eficientes, apesar do acesso limitado a semicondutores de ponta.
O CEO da Nvidia, Jensen Huang, criticou os controles de exportação na quarta-feira. "Os EUA basearam sua política na premissa de que a China não consegue fabricar chips de IA", disse ele. "Essa premissa sempre foi questionável e agora está claramente errada. A questão não é se a China terá IA. Ela já tem."
A DeepSeek aumentou o desempenho do modelo Qwen3 8B da Alibaba em 10%
A DeepSeek também afirmou ter destilado as etapas de raciocínio usadas no R1-0528 no Qwen3 8B Base da Alibaba. Esse processo criou um novo modelo menor que superou o desempenho do Qwen3 em mais de 10%, segundo a empresa. Ao mesmo tempo, o modelo era 30 vezes menor.
“Acreditamos que a linha de raciocínio do DeepSeek-R1-0528 terá grande importância para a pesquisa acadêmica sobre modelos de raciocínio e para o trabalho industrial com modelos de pequena escala”, afirmou a empresa.
Segundo a Reuters, um representante da DeepSeek disse em um grupo do WeChat que a mudança era uma "pequena atualização experimental" que já estava disponível para testes públicos. Em resposta à concorrência mais acirrada, o Google reduziu o preço de alguns planos do Gemini, enquanto a OpenAI lançou o modelo o3 Mini, de custo mais baixo.
Foto de 