A mais recente atualização de IA da DeepSeek desafia os modelos Qwen3 da Alibaba e o3 da OpenAI

Por

Shummas Humayun

Tempo de leitura: 2 minutos - 30 de maio de 2025

A mais recente atualização de IA da DeepSeek desafia o Qwen3 da Alibaba e o modelo o3 da OpenAI.

Foto de Solen Feyissa no Unsplash.

A DeepSeek lançou a versão R1-0528 como um grande reforço para seu modelo R1, após o desempenho superior obtido pelo Qwen3 da Alibaba.
O R1-0528 agora é compatível com modelos de grandes empresas de tecnologia como OpenAI o3, o4-mini e Gemini 2.5-Pro do Google.
A equipe condensou o raciocínio por trás do R1-0528 em uma versão base Qwen3 8B menor, que supera a original em 10%.

A DeepSeek lançou a versão R1-0528, uma grande atualização para o modelo de raciocínio R1 da startup chinesa, que havia sido lançado em janeiro. A atualização chegou apenas um mês depois de o Qwen3, do Alibaba Group Holding, ter superado o DeepSeek R1 original no LiveBench, um benchmark online para modelos de inteligência artificial de código aberto.

O modelo R1-0528 atualizado da DeepSeek agora se equipara em desempenho aos principais modelos de IA da OpenAI e do Google. Essa recuperação demonstra a rapidez com que as grandes empresas de tecnologia chinesas e as empresas de tecnologia mais recentes estão se esforçando para aprimorar suas ferramentas de IA.

Em seu comunicado, a DeepSeek afirmou que a versão R1-0528 demonstra melhor raciocínio e habilidades de escrita criativa. A atualização também traz uma capacidade de codificaçãotron. Mais importante ainda, a empresa alega que o modelo agora produz 50% menos "alucinações"

A DeepSeek explicou que as melhorias foram resultado do aumento da capacidade computacional investido durante a fase de pós-treinamento, quando os engenheiros ajustam o modelo após o processo principal de treinamento. Durante essa fase, o objetivo é aumentar a eficiência do modelo, bem como aprimorar sua precisão e segurança.

O R1-0528 agora está classificado logo atrás do o3 e do o4-mini da OpenAI

No LiveCodeBench, que mede o desempenho de modelos de IA, o R1-0528 agora está classificado logo atrás dos modelos o4-mini e o3 da OpenAI.

“A atualização mais recente do DeepSeek é mais precisa em raciocínio, maistronem matemática e código, e está se aproximando de modelos de ponta como Gemini e O3”, disse Adina Yakefu, pesquisadora de IA da Hugging Face.

Ela acrescentou que a nova versão apresenta "melhorias significativas na inferência e na redução de alucinações" e comprova que a startup não está apenas alcançando a concorrência, mas competindo ativamente.

O rápido progresso ocorreu depois que Washington restringiu as exportações de chips avançados e outras tecnologias para a China. Mesmo assim, as empresas chinesas continuam a aprimorar seus sistemas. No início deste mês, a Baidu e a Tencent descreveram maneiras pelas quais estão tornando seus modelos mais eficientes, apesar do acesso limitado a semicondutores de ponta.

O CEO da Nvidia, Jensen Huang, criticou os controles de exportação na quarta-feira. "Os EUA basearam sua política na premissa de que a China não consegue fabricar chips de IA", disse ele. "Essa premissa sempre foi questionável e agora está claramente errada. A questão não é se a China terá IA. Ela já tem."

A DeepSeek aumentou o desempenho do modelo Qwen3 8B da Alibaba em 10%

A DeepSeek também afirmou ter destilado as etapas de raciocínio usadas no R1-0528 no Qwen3 8B Base da Alibaba. Esse processo criou um novo modelo menor que superou o desempenho do Qwen3 em mais de 10%, segundo a empresa. Ao mesmo tempo, o modelo era 30 vezes menor.

“Acreditamos que a linha de raciocínio do DeepSeek-R1-0528 terá grande importância para a pesquisa acadêmica sobre modelos de raciocínio e para o trabalho industrial com modelos de pequena escala”, afirmou a empresa.

Segundo a Reuters, um representante da DeepSeek disse em um grupo do WeChat que a mudança era uma "pequena atualização experimental" que já estava disponível para testes públicos. Em resposta à concorrência mais acirrada, o Google reduziu o preço de alguns planos do Gemini, enquanto a OpenAI lançou o modelo o3 Mini, de custo mais baixo.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Alibaba CNY DeepSeek OpenAI USD

Compartilhe este artigo