ÚLTIMAS NOTÍCIAS
SELECIONADO PARA VOCÊ
SEMANALMENTE
MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

O Qwen3 da Alibaba desbanca o R1 da DeepSeek e agora lidera o mercado de modelos de IA de código aberto

PorFlorença MuchaiFlorença Muchai
Tempo de leitura: 3 minutos
  • A família de modelos de IA Qwen3 da Alibaba superou o R1 da DeepSeek e se tornou o melhor modelo de código aberto do mundo em áreas como ensino de idiomas, matemática, programação e análise de dados. 
  • O Qwen3 é barato de usar, pois custa apenas US$ 0,55 por 1 milhão de tokens para funcionar.
  • As fabricantes americanas de chips Nvidia e Intel começaram a dar suporte ao Qwen3.

A nova família de modelos de IA Qwen3 da Alibaba superou o R1 da DeepSeek e se tornou o melhor modelo de código aberto do mundo. Segundo relatos, o Qwen3 teve um desempenho melhor que o R1 em testes que avaliam as capacidades de modelos de IA de código aberto em áreas como ensino de idiomas, matemática, programação e análise de dados. 

A família Qwen3 foi lançada na semana passada pela unidade de computação em nuvem da Alibaba. Ela possui oito modelos aprimorados com entre 600 milhões e 235 bilhões de parâmetros. Em aprendizado de máquina, parâmetros são as variáveis ​​em um sistema de IA durante seu treinamento.

De acordo com a LiveBench , uma plataforma independentedent testa grandes modelos de linguagem, antes desses novos testes, o R1 da DeepSeek era o melhor modelo de IA de código aberto do mundo desde seu lançamento em janeiro. Mas isso mudou.

Empresas americanas e chinesas estão correndo para adotar o Qwen 3

A ascensão do Qwen3 no ranking do LiveBench demonstra a rapidez com que a IA está se desenvolvendo na China. O setor de tecnologia chinês cresceu muito graças às ferramentas de código aberto. O código aberto do método da Alibaba permitiu que outros desenvolvedores de software compartilhassem o design, corrigissem links quebrados ou tornassem o programa mais poderoso. 

No entanto, os resultados gerais do LiveBench mostraram que o Qwen3 não foi tão bom quanto o o3 da OpenAI, o Gemini Pro 2.5 do Google e o Claude 3.7 da Anthropic, que são os melhores modelos de IA proprietários do mundo. O LiveBench afirma que o o3-mini high, o modelo de IA mais popular da OpenAI, foi o melhor do mundo no geral. A Microsoft apoia a OpenAI.

Para cada 1 milhão de tokens, são necessários US$ 10 para executar o o3. Por outro lado, o Qwen3 é mais barato, pois custa apenas US$ 0,55 por 1 milhão de tokens. Como o Qwen3 é mais barato e funciona melhor, muitas empresas afirmaram que apoiariam o novo modelo de IA da Alibaba assim que fosse lançado.

A Huawei Technologies, a Moore Threads, a Cambricon Technologies e a Hygon Information Technology são todas empresas de chips que afirmaram que darão suporte ao Qwen3.

Na última terça-feira, a Cambricon anunciou que otimizou com sucesso o Qwen3 para rodar rapidamente em suas unidades de processamento gráfico. Isso ocorreu porque os desenvolvedores de IA nas Filipinas desejavam chips fabricados na China.

O Qwen3 também está sendo usado nos serviços de computação em nuvem da Hyperbolic e da Fireworks.ai, duas empresas de infraestrutura de IA. As fabricantes americanas de chips Nvidia e Intel começaram a oferecer suporte ao Qwen3.

Muitos grandes centros de dados na China, como os de Pequim, Xangai, Hangzhou e das províncias de Hubei, Jilin e noroeste de Shaanxi, também afirmaram que usarão os modelos de IA Qwen de terceira geração da Alibaba. A Rede de Supercomputação da China também adotou o Qwen3. Essa rede interliga mais de 20 centros de dados em 20 cidades, abrangendo 14 províncias.

O CEO da Anthropic afirma que a polêmica envolvendo o DeepSeek foi "um pouco exagerada"

Em um evento empresarial, um dos cofundadores da Anthropic, empresa que criou os modelos de IA Claude, afirmou que a DeepSeek ainda está "de seis a oito meses atrás das empresas líderes americanas". Ele também disse que o recente alvoroço em torno da startup chinesa era "talvez um pouco exagerado"

A DeepSeek chamou a atenção do mundo todo no final de dezembro de 2024 e início de janeiro de 2025 ao compartilhar dois modelos avançados de IA de código aberto, o V3 e o R1. Esses modelos foram criados por uma fração muito menor do custo e do poder computacional que as grandes empresas de tecnologia geralmente precisam para projetos de mestrado em direito.

Não está claro quando a DeepSeek lançará a próxima geração de seus modelos. A empresa sediada em Hangzhou lançou discretamente o Prover-V2, com 671 bilhões de parâmetros, no final de abril. Essa foi uma atualização de seu modelo especializado para lidar com demonstrações matemáticas. No entanto, a empresa não divulgou nenhuma informação sobre o progresso de seu tão aguardado modelo de raciocínio R2.

Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Florença Muchai

Florença Muchai

Florence é uma escritora de finanças com 6 anos de experiência cobrindo criptomoedas, jogos, tecnologia e inteligência artificial. Ela estudou Ciência da Computação na Universidade de Ciência e Tecnologia de Meru e Gestão de Desastres e Diplomacia Internacional na MMUST. Florence trabalhou no VAP Group e como editora para diversos veículos de mídia especializados em criptomoedas.

MAIS… NOTÍCIAS
INTENSIVO AVANÇADAS
CURSO