ÚLTIMAS NOTÍCIAS

31 segundos atrás - Opiniões do setor
O BYUSDT da Bybit abre uma oportunidade de rendimento duplo para os traders no lançamento do Bybit TradFi

37 minutos atrás - Opiniões do setor
Bitcoin precisa de trilhões em novo capital, mas as instituições estão investindo em IA

Notícias de 41 minutos atrás
A Comissão de Serviços Financeiros da Coreia do Sul (FSC) investiga manipulação de preços de grandes investidores em criptomoedas que utilizam o apelidado de "kimchi coins"

Notícias de 2 horas atrás

SELECIONADO PARA VOCÊ

O Qwen3 da Alibaba desbanca o R1 da DeepSeek e agora lidera o mercado de modelos de IA de código aberto

Por

Florença Muchai

Tempo de leitura: 3 minutos - 6 de maio de 2025

A família de modelos de IA Qwen3 da Alibaba superou o R1 da DeepSeek e se tornou o melhor modelo de código aberto do mundo em áreas como ensino de idiomas, matemática, programação e análise de dados.
O Qwen3 é barato de usar, pois custa apenas US$ 0,55 por 1 milhão de tokens para funcionar.
As fabricantes americanas de chips Nvidia e Intel começaram a dar suporte ao Qwen3.

A nova família de modelos de IA Qwen3 da Alibaba superou o R1 da DeepSeek e se tornou o melhor modelo de código aberto do mundo. Segundo relatos, o Qwen3 teve um desempenho melhor que o R1 em testes que avaliam as capacidades de modelos de IA de código aberto em áreas como ensino de idiomas, matemática, programação e análise de dados.

A família Qwen3 foi lançada na semana passada pela unidade de computação em nuvem da Alibaba. Ela possui oito modelos aprimorados com entre 600 milhões e 235 bilhões de parâmetros. Em aprendizado de máquina, parâmetros são as variáveis em um sistema de IA durante seu treinamento.

De acordo com a LiveBench , uma plataforma independentedent testa grandes modelos de linguagem, antes desses novos testes, o R1 da DeepSeek era o melhor modelo de IA de código aberto do mundo desde seu lançamento em janeiro. Mas isso mudou.

Empresas americanas e chinesas estão correndo para adotar o Qwen 3

A ascensão do Qwen3 no ranking do LiveBench demonstra a rapidez com que a IA está se desenvolvendo na China. O setor de tecnologia chinês cresceu muito graças às ferramentas de código aberto. O código aberto do método da Alibaba permitiu que outros desenvolvedores de software compartilhassem o design, corrigissem links quebrados ou tornassem o programa mais poderoso.

No entanto, os resultados gerais do LiveBench mostraram que o Qwen3 não foi tão bom quanto o o3 da OpenAI, o Gemini Pro 2.5 do Google e o Claude 3.7 da Anthropic, que são os melhores modelos de IA proprietários do mundo. O LiveBench afirma que o o3-mini high, o modelo de IA mais popular da OpenAI, foi o melhor do mundo no geral. A Microsoft apoia a OpenAI.

Para cada 1 milhão de tokens, são necessários US$ 10 para executar o o3. Por outro lado, o Qwen3 é mais barato, pois custa apenas US$ 0,55 por 1 milhão de tokens. Como o Qwen3 é mais barato e funciona melhor, muitas empresas afirmaram que apoiariam o novo modelo de IA da Alibaba assim que fosse lançado.

A Huawei Technologies, a Moore Threads, a Cambricon Technologies e a Hygon Information Technology são todas empresas de chips que afirmaram que darão suporte ao Qwen3.

Na última terça-feira, a Cambricon anunciou que otimizou com sucesso o Qwen3 para rodar rapidamente em suas unidades de processamento gráfico. Isso ocorreu porque os desenvolvedores de IA nas Filipinas desejavam chips fabricados na China.

O Qwen3 também está sendo usado nos serviços de computação em nuvem da Hyperbolic e da Fireworks.ai, duas empresas de infraestrutura de IA. As fabricantes americanas de chips Nvidia e Intel começaram a oferecer suporte ao Qwen3.

Muitos grandes centros de dados na China, como os de Pequim, Xangai, Hangzhou e das províncias de Hubei, Jilin e noroeste de Shaanxi, também afirmaram que usarão os modelos de IA Qwen de terceira geração da Alibaba. A Rede de Supercomputação da China também adotou o Qwen3. Essa rede interliga mais de 20 centros de dados em 20 cidades, abrangendo 14 províncias.

O CEO da Anthropic afirma que a polêmica envolvendo o DeepSeek foi "um pouco exagerada"

Em um evento empresarial, um dos cofundadores da Anthropic, empresa que criou os modelos de IA Claude, afirmou que a DeepSeek ainda está "de seis a oito meses atrás das empresas líderes americanas". Ele também disse que o recente alvoroço em torno da startup chinesa era "talvez um pouco exagerado"

A DeepSeek chamou a atenção do mundo todo no final de dezembro de 2024 e início de janeiro de 2025 ao compartilhar dois modelos avançados de IA de código aberto, o V3 e o R1. Esses modelos foram criados por uma fração muito menor do custo e do poder computacional que as grandes empresas de tecnologia geralmente precisam para projetos de mestrado em direito.

Não está claro quando a DeepSeek lançará a próxima geração de seus modelos. A empresa sediada em Hangzhou lançou discretamente o Prover-V2, com 671 bilhões de parâmetros, no final de abril. Essa foi uma atualização de seu modelo especializado para lidar com demonstrações matemáticas. No entanto, a empresa não divulgou nenhuma informação sobre o progresso de seu tão aguardado modelo de raciocínio R2.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Alibaba DeepSeek Qwen3

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Florença Muchai

Florence tem se dedicado à cobertura de notícias sobre criptomoedas, jogos, tecnologia e inteligência artificial nos últimos 6 anos. Seus estudos em Ciência da Computação pela Universidade de Ciência e Tecnologia de Meru e em Gestão de Desastres e Diplomacia Internacional pela MMUST (Universidade de Ciência e Tecnologia de Meru) lhe proporcionaram ampla experiência em idiomas, observação e habilidades técnicas. Florence trabalhou no VAP Group e como editora para diversos veículos de mídia especializados em criptomoedas.

ÍNDICE

1. Empresas americanas e chinesas estão correndo para adotar o Qwen 3

2. O CEO da Anthropic afirma que a polêmica envolvendo o DeepSeek foi "um pouco exagerada"

Compartilhe este artigo

MAIS… NOTÍCIAS

MOSTRAR TUDO

5 aplicações engenhosas do ChatGPT e o que você deve fazer a respeito

Há 3 anos, John Palmer, da área de tecnologia

93% dos líderes empresariais preferem soluções baseadas em IA para a gestão da sustentabilidade da marca, segundo a Reuters

Há 3 anos, John Palmer, da área de tecnologia

Eis como Macron apoia o ecossistema de IA vibrante e produtivo da França

Há 3 anos, Tech Glory Kaburu

A Bloomberg estima que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032

3 anos atrás, Aamir Sheikh, da área de tecnologia

O que é Base? A rede Ethereum de camada 2 lançada pela Coinbase

21 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Dogecoin vs. Bitcoin: Principais Diferenças Técnicas

20 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é TVL (Valor Total Bloqueado) em criptomoedas?

14 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Como ler um white paper de criptomoedas?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Ripple vs. XRP vs. XRP Ledger: Qual a diferença?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é uma carteira multisig em criptomoedas?

10 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes

CURSO INTENSIVO DE CRIPTOMOEDAS AVANÇADAS

Quais criptomoedas podem te fazer ganhar dinheiro?
Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
Estratégias de investimento pouco conhecidas que os profissionais utilizam
Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)