Tencent revela modelo de raciocínio T1 em meio à corrida pela IA na China

- A Tencent lançou o Hunyuan T1 para competir com o R1 da DeepSeek.
- O T1 obteve bons resultados em testes de benchmark de IA, superando o DeepSeek-R1 em alguns deles.
- A Tencent está usando tanto seus próprios modelos de IA quanto o R1 da DeepSeek em sua plataforma de nuvem.
A Tencent Holdings apresentou um novo modelo de raciocínio de inteligência artificial (IA), o Hunyuan T1, projetado para competir com o R1 da DeepSeek tanto em desempenho quanto em preço acessível.
Apresentado na sexta-feira, o T1 utiliza aprendizado por reforço em larga escala, a mesma técnica que a DeepSeek usou em seu modelo R1, lançado em janeiro.
O T1 demonstra um desempenhotronem todos os benchmarks
O lançamento oficial ocorre após um teste beta da prévia do T1 no chatbot da Tencent, Yuanbao. O modelo obteve 87,2 pontos no benchmark Massive Multitask Language Understanding (MMLU) Pro, superando os 84 pontos do DeepSeek-R1, mas ficando aquém do o1 da OpenAI, que alcançou 89,3.
A T1 também demonstrou resultadostronem outras avaliações, alcançando 78,2 pontos no Exame Americano dematicpor Convite (AIME) de 2024, em comparação com os 79,8 pontos da R1 e os 79,2 da o1. De acordo com a Tencent, a T1 se destacou na proficiência em língua chinesa, obtendo 91,8 pontos no conjunto de avaliações C-Eval, igualando a pontuação da R1 e superando os 87,8 pontos da o1.
O modelo da Tencent também rivaliza com o da DeepSeek em termos de preços, o que representa uma grande vantagem para a popular startup chinesa. A T1 cobra 1 yuan (US$ 0,14) por 1 milhão de tokens de entrada, enquanto a saída custa 4 yuans por milhão de tokens.
A taxa de entrada está em linha com a da R1, que cobra 1 yuan por milhão de tokens durante o dia e apenas 0,25 yuan durante a noite. O preço de saída também é comparável, visto que a taxa diurna da R1 é de 16 yuan por milhão de tokens, caindo para 4 yuan durante a noite.
Segundo a Tencent, ela é a primeira do setor a adotar uma arquitetura híbrida, incluindo o Transformer do Google, juntamente com um sistema fornecido por geradores da Universidade Carnegie Mellon e da Universidade de Princeton, chamado Mamba. Isso reduz significativamente os custos de treinamento e inferência e otimiza o uso de memória durante o treinamento, em comparação com uma arquitetura totalmente baseada em Transformer, afirma a empresa.
A empresa promove o T1 como uma tecnologia que "reduz significativamente o consumo de recursos, garantindo ao mesmo tempo a capacidade de capturar informações de texto longas", permitindo velocidades de decodificação 200% mais rápidas.
Um ex-especialista em big data da JD.com, que escrevia o blog de tecnologia NCJRYDS, testou os modelos T1 e R1 nas mesmas tarefas. Em seguida, ele solicitou que outros grandes modelos de linguagem, incluindo o Claude da Anthropic e o ChatGPT da OpenAI, avaliassem os resultados.
O modelo da Tencent perdeu o duelo na redação de um antigo poema chinês, mas venceu o DeepSeek na interpretação de uma palavra chinesa em diferentes contextos.
Outro blog, o GoPlayAI, apresentou quatromatic, e após cinco minutos de trabalho, ele errou a mais difícil.
A Tencent expande sua estratégia de IA com uma abordagem de núcleo duplo
A Tencent, que opera o WeChat, o maior aplicativo de mídia social da China, e a maior empresa de jogos eletrônicos do mundo em receita, está posicionando a IA como uma nova fonte de receita principal. A empresa integrou o DeepSeek-R1 à sua plataforma em nuvem e ao chatbot Yuanbao, oferecendo uma alternativa aos seus próprios modelos Hunyuan.
O presidente e CEO da Tencent, Pony Ma Huateng, observou recentemente que tinha grande respeito pela DeepSeek por criar "um produtodent, verdadeiramente de código aberto e gratuito".
Ma afirmou que a Tencent adotou uma estratégia de "núcleo duplo" em IA, que utiliza tanto o DeepSeek quanto seus próprios modelos Yuanbao. Essa abordagem é semelhante à forma como a empresa dominou a indústria de videogames, promovendo títulos desenvolvidos internamente e por estúdiosdent .
As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.
Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Nélio Irene
Nellius é formada em Administração de Empresas e TI, com cinco anos de experiência no setor de criptomoedas. Ela também é graduada pela Bitcoin Dada. Nellius já contribuiu para importantes publicações de mídia, incluindo BanklessTimes, Cryptobasic e Riseup Media.
CURSO
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)















