O Qwen3 da Alibaba desbanca o R1 da DeepSeek e agora lidera o mercado de modelos de IA de código aberto

- A família de modelos de IA Qwen3 da Alibaba superou o R1 da DeepSeek e se tornou o melhor modelo de código aberto do mundo em áreas como ensino de idiomas, matemática, programação e análise de dados.
- O Qwen3 é barato de usar, pois custa apenas US$ 0,55 por 1 milhão de tokens para funcionar.
- As fabricantes americanas de chips Nvidia e Intel começaram a dar suporte ao Qwen3.
A nova família de modelos de IA Qwen3 da Alibaba superou o R1 da DeepSeek e se tornou o melhor modelo de código aberto do mundo. Segundo relatos, o Qwen3 teve um desempenho melhor que o R1 em testes que avaliam as capacidades de modelos de IA de código aberto em áreas como ensino de idiomas, matemática, programação e análise de dados.
A família Qwen3 foi lançada na semana passada pela unidade de computação em nuvem da Alibaba. Ela possui oito modelos aprimorados com entre 600 milhões e 235 bilhões de parâmetros. Em aprendizado de máquina, parâmetros são as variáveis em um sistema de IA durante seu treinamento.
De acordo com a LiveBench , uma plataforma independentedent testa grandes modelos de linguagem, antes desses novos testes, o R1 da DeepSeek era o melhor modelo de IA de código aberto do mundo desde seu lançamento em janeiro. Mas isso mudou.
Empresas americanas e chinesas estão correndo para adotar o Qwen 3
A ascensão do Qwen3 no ranking do LiveBench demonstra a rapidez com que a IA está se desenvolvendo na China. O setor de tecnologia chinês cresceu muito graças às ferramentas de código aberto. O código aberto do método da Alibaba permitiu que outros desenvolvedores de software compartilhassem o design, corrigissem links quebrados ou tornassem o programa mais poderoso.
No entanto, os resultados gerais do LiveBench mostraram que o Qwen3 não foi tão bom quanto o o3 da OpenAI, o Gemini Pro 2.5 do Google e o Claude 3.7 da Anthropic, que são os melhores modelos de IA proprietários do mundo. O LiveBench afirma que o o3-mini high, o modelo de IA mais popular da OpenAI, foi o melhor do mundo no geral. A Microsoft apoia a OpenAI.
Para cada 1 milhão de tokens, são necessários US$ 10 para executar o o3. Por outro lado, o Qwen3 é mais barato, pois custa apenas US$ 0,55 por 1 milhão de tokens. Como o Qwen3 é mais barato e funciona melhor, muitas empresas afirmaram que apoiariam o novo modelo de IA da Alibaba assim que fosse lançado.
A Huawei Technologies, a Moore Threads, a Cambricon Technologies e a Hygon Information Technology são todas empresas de chips que afirmaram que darão suporte ao Qwen3.
Na última terça-feira, a Cambricon anunciou que otimizou com sucesso o Qwen3 para rodar rapidamente em suas unidades de processamento gráfico. Isso ocorreu porque os desenvolvedores de IA nas Filipinas desejavam chips fabricados na China.
O Qwen3 também está sendo usado nos serviços de computação em nuvem da Hyperbolic e da Fireworks.ai, duas empresas de infraestrutura de IA. As fabricantes americanas de chips Nvidia e Intel começaram a oferecer suporte ao Qwen3.
Muitos grandes centros de dados na China, como os de Pequim, Xangai, Hangzhou e das províncias de Hubei, Jilin e noroeste de Shaanxi, também afirmaram que usarão os modelos de IA Qwen de terceira geração da Alibaba. A Rede de Supercomputação da China também adotou o Qwen3. Essa rede interliga mais de 20 centros de dados em 20 cidades, abrangendo 14 províncias.
O CEO da Anthropic afirma que a polêmica envolvendo o DeepSeek foi "um pouco exagerada"
Em um evento empresarial, um dos cofundadores da Anthropic, empresa que criou os modelos de IA Claude, afirmou que a DeepSeek ainda está "de seis a oito meses atrás das empresas líderes americanas". Ele também disse que o recente alvoroço em torno da startup chinesa era "talvez um pouco exagerado"
A DeepSeek chamou a atenção do mundo todo no final de dezembro de 2024 e início de janeiro de 2025 ao compartilhar dois modelos avançados de IA de código aberto, o V3 e o R1. Esses modelos foram criados por uma fração muito menor do custo e do poder computacional que as grandes empresas de tecnologia geralmente precisam para projetos de mestrado em direito.
Não está claro quando a DeepSeek lançará a próxima geração de seus modelos. A empresa sediada em Hangzhou lançou discretamente o Prover-V2, com 671 bilhões de parâmetros, no final de abril. Essa foi uma atualização de seu modelo especializado para lidar com demonstrações matemáticas. No entanto, a empresa não divulgou nenhuma informação sobre o progresso de seu tão aguardado modelo de raciocínio R2.
Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.
Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Florença Muchai
Florence é uma escritora de finanças com 6 anos de experiência cobrindo criptomoedas, jogos, tecnologia e inteligência artificial. Ela estudou Ciência da Computação na Universidade de Ciência e Tecnologia de Meru e Gestão de Desastres e Diplomacia Internacional na MMUST. Florence trabalhou no VAP Group e como editora para diversos veículos de mídia especializados em criptomoedas.
CURSO
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)














