Your bank is using your money. You’re getting the scraps.WATCH FREE

A mais recente atualização de IA da DeepSeek desafia os modelos Qwen3 da Alibaba e o3 da OpenAI

Neste post:

  • A DeepSeek lançou a versão R1-0528 como um grande reforço para seu modelo R1, após o desempenho superior obtido pelo Qwen3 da Alibaba.
  • O R1-0528 agora é compatível com modelos de grandes empresas de tecnologia como OpenAI o3, o4-mini e Gemini 2.5-Pro ​​do Google.
  • A equipe condensou o raciocínio por trás do R1-0528 em uma versão base Qwen3 8B menor, que supera a original em 10%.

A DeepSeek lançou a versão R1-0528, uma grande atualização para o modelo de raciocínio R1 da startup chinesa, que havia sido lançado em janeiro. A atualização chegou apenas um mês depois de o Qwen3, do Alibaba Group Holding, ter superado o DeepSeek R1 original no LiveBench, um benchmark online para modelos de inteligência artificial de código aberto.

O modelo R1-0528 atualizado da DeepSeek agora se equipara em desempenho aos principais modelos de IA da OpenAI e do Google. Essa recuperação demonstra a rapidez com que as grandes empresas de tecnologia chinesas e as empresas de tecnologia mais recentes estão se esforçando para aprimorar suas ferramentas de IA.

Em seu comunicado, a DeepSeek afirmou que a versão R1-0528 demonstra melhor raciocínio e habilidades de escrita criativa. A atualização também traz uma capacidade de codificaçãotron. Mais importante ainda, a empresa alega que o modelo agora produz 50% menos "alucinações"

A DeepSeek explicou que as melhorias foram resultado do aumento da capacidade computacional investido durante a fase de pós-treinamento, quando os engenheiros ajustam o modelo após o processo principal de treinamento. Durante essa fase, o objetivo é aumentar a eficiência do modelo, bem como aprimorar sua precisão e segurança.

O R1-0528 agora está classificado logo atrás do o3 e do o4-mini da OpenAI

No LiveCodeBench, que mede o desempenho de modelos de IA, o R1-0528 agora está classificado logo atrás dos modelos o4-mini e o3 da OpenAI.

“A atualização mais recente do DeepSeek é mais precisa em raciocínio, maistronem matemática e código, e está se aproximando de modelos de ponta como Gemini e O3”, disse Adina Yakefu, pesquisadora de IA da Hugging Face.

Ela acrescentou que a nova versão apresenta "melhorias significativas na inferência e na redução de alucinações" e comprova que a startup não está apenas alcançando a concorrência, mas competindo ativamente.

Veja também:  Administração Trump planeja demissões em massa em importante agência de IA e apoia empresas de tecnologia contra as regras de IA da UE

O rápido progresso ocorreu depois que Washington restringiu as exportações de chips avançados e outras tecnologias para a China. Mesmo assim, as empresas chinesas continuam a aprimorar seus sistemas. No início deste mês, a Baidu e a Tencent descreveram maneiras pelas quais estão tornando seus modelos mais eficientes, apesar do acesso limitado a semicondutores de ponta.

O CEO da Nvidia, Jensen Huang, criticou os controles de exportação na quarta-feira. "Os EUA basearam sua política na premissa de que a China não consegue fabricar chips de IA", disse ele. "Essa premissa sempre foi questionável e agora está claramente errada. A questão não é se a China terá IA. Ela já tem."

A DeepSeek aumentou o desempenho do modelo Qwen3 8B da Alibaba em 10%

A DeepSeek também afirmou ter destilado as etapas de raciocínio usadas no R1-0528 no Qwen3 8B Base da Alibaba. Esse processo criou um novo modelo menor que superou o desempenho do Qwen3 em mais de 10%, segundo a empresa. Ao mesmo tempo, o modelo era 30 vezes menor.

“Acreditamos que a linha de raciocínio do DeepSeek-R1-0528 terá grande importância para a pesquisa acadêmica sobre modelos de raciocínio e para o trabalho industrial com modelos de pequena escala”, afirmou a empresa.

Segundo a Reuters, um representante da DeepSeek disse em um grupo do WeChat que a mudança era uma "pequena atualização experimental" que já estava disponível para testes públicos. Em resposta à concorrência mais acirrada, o Google reduziu o preço de alguns planos do Gemini, enquanto a OpenAI lançou o modelo o3 Mini, de custo mais baixo.

Veja também:  A disrupção da IA ​​na terapia: uma preocupação para os profissionais de saúde mental.

Suas chaves, seu cartão. Gaste sem abrir mão da custódia e ganhe mais de 8% de rendimento sobre seu saldo com o Ether.fi Cash .

Compartilhar link:

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. O Cryptopolitan não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamos tron a realização de pesquisas independentes dent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Mais lidas

Carregando os artigos mais lidos...

Fique por dentro das notícias sobre criptomoedas e receba atualizações diárias na sua caixa de entrada

Escolha do editor

Carregando artigos selecionados pela equipe editorial...

- A newsletter de criptomoedas que te mantém sempre um passo à frente -

Os mercados se movem rapidamente.

Nós nos movemos mais rápido.

Assine o Cryptopolitan Daily e receba informações oportunas, precisas e relevantes sobre criptomoedas diretamente na sua caixa de entrada.

Inscreva-se agora e
não perca nenhum lance.

Entre. Informe-se.
Saia na frente.

Inscreva-se no CryptoPolitan