Tencent Holdings ha introducido un nuevo modelo de razonamiento de inteligencia artificial (IA), Hunyuan T1, diseñado para competir con el R1 de Deepseek en rendimiento y asequibilidad.
Presentado el viernes, T1 aprovecha el aprendizaje de refuerzo a gran escala, la misma técnica profunda utilizada en su modelo R1 lanzado en enero .
T1 demuestra el rendimiento de StronG en los puntos de referencia
El lanzamiento oficial sigue una prueba beta de la vista previa de T1 sobre el chatbot de Tencent, Yuanbao. El modelo anotó 87.2 puntos en el punto de referencia PRO de comprensión de lenguaje multitarea masiva (MMLU), superando los 84 puntos de Deepseek-R1 pero que no alcanzan el O1 de OpenAi, que logró 89.3.
T1 también demostró los resultados de StronG en otras evaluaciones, anotando 78.2 en el Examen dematicInvitacional Americana de 2024 (AIME), en comparación con el 79.8 y el 79.2 de O1 de R1. Según Tencent, se destacó en el dominio del idioma chino, anotando 91.8 puntos en la suite C-Eval, coincidiendo con R1 y superando los 87.8 de O1.
El modelo Tencent también rivaliza precios de los precios, lo cual es una ventaja principal para la nueva empresa china popular. T1 cobra 1 yuan ($ 0.14) por 1 millón de tokens de entrada, mientras que la producción cuesta 4 yuanes por millón de tokens.
La tasa de entrada está en línea con R1, que cobra 1 yuan por millón de tokens durante las horas diurnas y solo 0.25 yuanes durante la noche. El precio de salida también es comparable, dada la tasa diurna de R1 de 16 yuanes por millón de tokens, que cae a 4 yuanes durante la noche.
Según Tencent, es el primero en la industria en adoptar una arquitectura híbrida, incluido el transformador de Google, junto con un sistema proporcionado por generadores de la Universidad Carnegie Mellon y la Universidad de Princeton llamado Mamba. Esto reduce significativamente los costos de capacitación e inferencia y optimiza el uso de la memoria durante la capacitación en comparación con una arquitectura totalmente basada en transformadores, según la compañía.
La compañía promueve la T1 como "reduciendo significativamente el consumo de recursos al tiempo que garantiza la capacidad de capturar información de texto larga", lo que permite velocidades de decodificación del 200% más rápidas.
Un ex experto en datos de JD.com escribió el blog de tecnología NCJRYDS y probó T1 y R1 en las mismas tareas. Luego, el individuo solicitó a otros modelos de idiomas grandes, incluidos Claude de Anthrope y ChatGPT de OpenAi, que juzguen los resultados.
El modelo de Tencent perdió el duelo al escribir un antiguo poema chino pero venció a Deepseek al interpretar una palabra china en diferentes contextos.
Otro blog, Goplayai, dio al Tencent Model Four Mathe matic Al preguntas, y después de pasar cinco minutos en él, se equivocó más .
Tencent expande su estrategia de IA con un enfoque de doble núcleo
Tencent, que opera la aplicación de redes sociales más grande de China, WeChat, y el negocio de videojuegos más grande del mundo por ingresos, está posicionando la IA como un nuevo flujo de ingresos básicos. La firma ha integrado Deepseek-R1 en su plataforma en la nube y Yuanbao Chatbot, ofreciendo una alternativa junto con sus propios modelos Hunyuan.
El presidente y CEO de Tencent, Pony Ma Huateng, señaló recientemente que tenía un gran respeto por Deepseek por hacer "unadentindependiente, verdaderamente de código abierto y producto gratuito".
Ma dijo Tencent ha adoptado una estrategia de "doble núcleo" en la IA que utiliza tanto Deepseek como sus propios modelos Yuanbao. Este enfoque es similar a cómo ha dominado la industria de los videojuegos al promover títulos autodesarrollados y los de Independent Studios.
Academia Cryptopolitan: ¿Cansado de columpios del mercado? Aprenda cómo DeFi puede ayudarlo a generar ingresos pasivos constantes. Registrarse ahora