ÚLTIMAS NOTÍCIAS
SELECIONADO PARA VOCÊ
SEMANALMENTE
MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

Tencent revela modelo de raciocínio T1 em meio à corrida pela IA na China

PorNélio IreneNélio Irene
Tempo de leitura: 2 minutos
A Tencent revela o modelo de raciocínio T1 em meio à acirrada corrida pela IA na China.
  • A Tencent lançou o Hunyuan T1 para competir com o R1 da DeepSeek.
  • O T1 obteve bons resultados em testes de benchmark de IA, superando o DeepSeek-R1 em alguns deles.
  • A Tencent está usando tanto seus próprios modelos de IA quanto o R1 da DeepSeek em sua plataforma de nuvem.

A Tencent Holdings apresentou um novo modelo de raciocínio de inteligência artificial (IA), o Hunyuan T1, projetado para competir com o R1 da DeepSeek tanto em desempenho quanto em preço acessível.

Apresentado na sexta-feira, o T1 utiliza aprendizado por reforço em larga escala, a mesma técnica que a DeepSeek usou em seu modelo R1, lançado em janeiro

O T1 demonstra um desempenhotronem todos os benchmarks

O lançamento oficial ocorre após um teste beta da prévia do T1 no chatbot da Tencent, Yuanbao. O modelo obteve 87,2 pontos no benchmark Massive Multitask Language Understanding (MMLU) Pro, superando os 84 pontos do DeepSeek-R1, mas ficando aquém do o1 da OpenAI, que alcançou 89,3.

A T1 também demonstrou resultadostronem outras avaliações, alcançando 78,2 pontos no Exame Americano dematicpor Convite (AIME) de 2024, em comparação com os 79,8 pontos da R1 e os 79,2 da o1. De acordo com a Tencent, a T1 se destacou na proficiência em língua chinesa, obtendo 91,8 pontos no conjunto de avaliações C-Eval, igualando a pontuação da R1 e superando os 87,8 pontos da o1.

O modelo da Tencent também rivaliza com o da DeepSeek em termos de preços, o que representa uma grande vantagem para a popular startup chinesa. A T1 cobra 1 yuan (US$ 0,14) por 1 milhão de tokens de entrada, enquanto a saída custa 4 yuans por milhão de tokens.

A taxa de entrada está em linha com a da R1, que cobra 1 yuan por milhão de tokens durante o dia e apenas 0,25 yuan durante a noite. O preço de saída também é comparável, visto que a taxa diurna da R1 é de 16 yuan por milhão de tokens, caindo para 4 yuan durante a noite.

Segundo a Tencent, ela é a primeira do setor a adotar uma arquitetura híbrida, incluindo o Transformer do Google, juntamente com um sistema fornecido por geradores da Universidade Carnegie Mellon e da Universidade de Princeton, chamado Mamba. Isso reduz significativamente os custos de treinamento e inferência e otimiza o uso de memória durante o treinamento, em comparação com uma arquitetura totalmente baseada em Transformer, afirma a empresa.

A empresa promove o T1 como uma tecnologia que "reduz significativamente o consumo de recursos, garantindo ao mesmo tempo a capacidade de capturar informações de texto longas", permitindo velocidades de decodificação 200% mais rápidas.

Um ex-especialista em big data da JD.com, que escrevia o blog de tecnologia NCJRYDS, testou os modelos T1 e R1 nas mesmas tarefas. Em seguida, ele solicitou que outros grandes modelos de linguagem, incluindo o Claude da Anthropic e o ChatGPT da OpenAI, avaliassem os resultados.

O modelo da Tencent perdeu o duelo na redação de um antigo poema chinês, mas venceu o DeepSeek na interpretação de uma palavra chinesa em diferentes contextos.

Outro blog, o GoPlayAI, apresentou quatromatic, e após cinco minutos de trabalho, ele errou a mais difícil.

A Tencent expande sua estratégia de IA com uma abordagem de núcleo duplo

A Tencent, que opera o WeChat, o maior aplicativo de mídia social da China, e a maior empresa de jogos eletrônicos do mundo em receita, está posicionando a IA como uma nova fonte de receita principal. A empresa integrou o DeepSeek-R1 à sua plataforma em nuvem e ao chatbot Yuanbao, oferecendo uma alternativa aos seus próprios modelos Hunyuan.

O presidente e CEO da Tencent, Pony Ma Huateng, observou recentemente que tinha grande respeito pela DeepSeek por criar "um produtodent, verdadeiramente de código aberto e gratuito".

Ma afirmou que a Tencent adotou uma estratégia de "núcleo duplo" em IA, que utiliza tanto o DeepSeek quanto seus próprios modelos Yuanbao. Essa abordagem é semelhante à forma como a empresa dominou a indústria de videogames, promovendo títulos desenvolvidos internamente e por estúdiosdent .

As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Nélio Irene

Nélio Irene

Nellius é formada em Administração de Empresas e TI, com cinco anos de experiência no setor de criptomoedas. Ela também é graduada pela Bitcoin Dada. Nellius já contribuiu para importantes publicações de mídia, incluindo BanklessTimes, Cryptobasic e Riseup Media.

MAIS… NOTÍCIAS
INTENSIVO AVANÇADAS
CURSO