Tencent Holdings a introduit un nouveau modèle de raisonnement de l'intelligence artificielle (AI), Hunyuan T1, conçu pour rivaliser avec le R1 de Deepseek dans la performance et l'abordabilité.
Dévoilé vendredi, T1 exploite l'apprentissage par renforcement à grande échelle, la même technique Deepseek utilisée dans son modèle R1 lancé en janvier .
T1 démontre les performancestronG à travers les repères
La version officielle suit un test bêta de l'aperçu T1 sur le chatbot de Tencent, Yuanbao. Le modèle a marqué 87,2 points sur la référence massive de la compréhension du langage multitâche (MMLU) Pro, dépassant les 84 points de Deepseek-R1, mais ne dépassant pas l'O1 d'Openai, qui a atteint 89,3.
T1 a également démontré que les résultats detronG dans d'autres évaluations, notant 78,2 dans l'examen American Invitational Mathematic(AIME), par rapport aux 79,8 et O1 de R1. Selon Tencent, il a excellé dans la compétence en chinois, marquant 91,8 points dans la suite C-Eval, correspondant à R1 et surperformant l'O1 87,8.
Le modèle Tencent rivalise également en profondeur dans les prix, ce qui est un avantage principal pour la start-up chinoise populaire. T1 facture 1 yuan (0,14 $) par 1 million de jetons de contribution, tandis que la production coûte 4 yuans par million de jetons.
Le taux d'entrée est conforme à R1, qui facture 1 yuan par million de jetons pendant les heures de jour et seulement 0,25 yuan pendant la nuit. La tarification de la production est également comparable, compte tenu du taux diurne de R1 de 16 yuans par million de jetons, qui tombe à 4 yuans du jour au lendemain.
Selon Tencent, il est le premier de l'industrie à adopter une architecture hybride, y compris le transformateur de Google, ainsi qu'un système fourni par un générateur de l'Université Carnegie Mellon et de l'Université de Princeton appelée Mamba. Cela réduit considérablement les coûts de formation et d'inférence et optimise l'utilisation de la mémoire pendant la formation par rapport à une architecture entièrement basée sur le transformateur, indique la société.
La société promeut T1 comme «réduisant considérablement la consommation de ressources tout en garantissant la possibilité de capturer de longues informations sur le texte», permettant des vitesses de décodage de 200% plus rapides.
Un ancien expert JD.com Big-Data a écrit le blog technologique NCJRYDS et testé T1 et R1 sur les mêmes tâches. L'individu a ensuite demandé à d'autres modèles de grandes langues, y compris Claude d'Anthropic et le Chatgpt d'Openai, pour juger des résultats.
Le modèle de Tencent a perdu le duel en écrivant un ancien poème chinois mais a battu Deepseek en interprétant un mot chinois dans différents contextes.
Un autre blog, Goplayai, a posé les questions Tencent Model Four Mathe matic AL, et après avoir passé cinq minutes, cela s'est trompé le plus difficile.
Tencent étend sa stratégie d'IA avec une approche double cœur
Tencent, qui exploite la plus grande application chinoise des médias sociaux, WeChat, et la plus grande entreprise de jeux vidéo au monde en termes de revenus, positionne l'IA en tant que nouvelle source de revenus de base. L'entreprise a intégré Deepseek-R1 dans sa plate-forme cloud et Yuanbao Chatbot, offrant une alternative aux côtés de ses propres modèles Hunyuan.
Le président-directeur général de Tencent, Pony Ma Huateng, a récemment noté qu'il avait un grand respect pour Deepseek pour avoir fait «undentindépendant, vraiment open-open et un produit gratuit».
Ma a déclaré que Tencent a adopté une stratégie de «double noyau» sur l'IA qui utilise à la fois Deepseek et ses propres modèles Yuanbao. Cette approche est similaire à la façon dont il a dominé l'industrie du jeu vidéo en faisant la promotion de titres auto-développés et ceux des studiosdent .
Le fil de différence clé aide les marques de crypto à briser et à dominer les titres rapidement