FREE REPORT: A New Way to Earn Passive Income in 2025 DOWNLOAD

A mais recente atualização da AI de Deepseek desafia

Nesta postagem:

  • O Deepseek lançou R1-0528 como um grande impulso para o seu modelo R1 depois que o QWEN3 do Alibaba o superou.
  • R1-0528 agora corresponde a modelos de grandes empresas de tecnologia como OpenAI O3, O4-Mini e Gemini 2.5-Pro ​​do Google.
  • A equipe destilou a cadeia de pensamento da R1-0528 em uma versão básica menor QWEN3 8B que supera o original em 10%.

A Deepseek lançou o R1-0528, uma grande atualização para o modelo de raciocínio R1 da start-up chinês, lançado em janeiro. A atualização chegou apenas um mês depois que o QWEN3 do Alibaba Group Holding venceu o Deepseek R1 original em Livebench, um benchmark on-line para modelos de inteligência artificial de código aberto.

O modelo R1-0528 atualizado da DeepSeek agora está ao lado dos modelos de IA líderes do OpenAI e Google no desempenho. O retorno mostra a rapidez com que as grandes empresas de tecnologia e empresas de tecnologia mais recentes estão pressionando para melhorar suas ferramentas de IA.

Em seu comunicado, Deepseek disse que R1-0528 mostra melhores habilidades de raciocínio e escrita criativa. A atualização também traz a capacidade de codificaçãotronGer. Mais importante, a empresa afirma que o modelo agora produz 50% menos "alucinações".

A Deepseek explicou que as atualizações vieram de poder de computação extra investido durante a fase pós-treinamento, quando os engenheiros ajustam um modelo após o principal processo de treinamento. Durante a fase pós-treinamento, os engenheiros visam aumentar a eficiência do modelo e aprimorar sua precisão e segurança.

R1-0528 agora está logo atrás do OpenAi e O4-Mini do Openai

No LivecodeBench, que mede o desempenho do modelo de IA, o R1-0528 agora está logo atrás dos modelos O4-Mini e O3 do Openai.

"A última atualização da Deepseek é mais nítida sobre o raciocínio, otronGer sobre matemática e código e fechando modelos de primeira linha como Gemini e O3", disse Adina Yakefu, pesquisadora de IA da Hugging Face.

Ela acrescentou que a nova versão mostra "grandes melhorias na inferência e redução de alucinação" e prova que a start-up não está apenas alcançando, mas competindo ativamente.

Veja também  Oficiais dos EUA enganados pela AI Voice Scam posando como Secretário de Estado Rubio

O rápido progresso ocorreu depois que Washington restringiu chips avançados e outras exportações de tecnologia para a China. No entanto, as empresas chinesas continuam a refinar seus sistemas. No início deste mês, Baidu e Tencent descreveram maneiras pelas quais estão fazendo seus modelos funcionarem com mais eficiência, apesar do acesso limitado a semicondutores de ponta.

O executivo -chefe da Nvidia, Jensen Huang, criticou os controles de exportação na quarta -feira. "Os EUA basearam sua política na suposição de que a China não pode fazer chips de IA", disse ele. "Essa suposição sempre foi questionável e agora está claramente errada. A questão não é se a China terá IA. Já faz."

Deepseek aumentou o desempenho do modelo QWEN3 8B do Alibaba em 10%

A Deepseek também disse que destilou as etapas de raciocínio usadas em R1-0528 no QWEN3 8B do Alibaba. Esse processo criou um modelo novo e menor que superou o desempenho da QWEN3 em mais de 10%, segundo a empresa. Ao mesmo tempo, o modelo era 30 vezes menor.

"Acreditamos que a cadeia de pensamentos da DeepSeek-R1-0528 terá uma importância significativa para pesquisas acadêmicas sobre modelos de raciocínio e trabalho industrial em pequenos modelos", afirmou a empresa.

Segundo a Reuters, um representante do Deepseek disse a um grupo do WeChat que a mudança era uma "atualização de julgamento menor" que já estava aberta para testes públicos. Em resposta à competição mais feroz, o Google desconsiderou algumas camadas de acesso de Gemini, enquanto o OpenAI introduziu o modelo O3 Mini de menor custo.

Veja também  O juiz rejeita o pedido de Tiktok para descartar um processo estadual

Academia Cryptopolitan: em breve - uma nova maneira de obter renda passiva com DeFi em 2025. Saiba mais

Compartilhar link:

Isenção de responsabilidade. As informações fornecidas não são conselhos de negociação. Cryptopolitan.com não se responsabiliza por quaisquer investimentos feitos com base nas informações fornecidas nesta página. Recomendamos tron dent e /ou consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Mais Lidos

Carregando artigos mais lidos...

Fique por dentro das notícias sobre criptografia, receba atualizações diárias em sua caixa de entrada

Escolha do editor

Carregando artigos da Escolha do Editor...

- O boletim informativo criptográfico que o mantém à frente -

Os mercados se movem rapidamente.

Nós nos movemos mais rápido.

Inscreva -se no Cryptopolitan diariamente e fique com as informações de criptografia oportunas, nítidas e relevantes diretamente para sua caixa de entrada.

Junte -se agora e
nunca perca um movimento.

Entre. Obtenha os fatos.
Siga em frente.

Assine o CryptoPolitan