COMING SOON: A New Way to Earn Passive Income with DeFi in 2025 LEARN MORE

Tencent presenta el modelo de razonamiento T1 mientras la carrera de IA se calienta en China

En esta publicación:

  • Tencent ha lanzado Hunyuan T1 para competir con Deepseek's R1.
  • T1 obtuvo un buen puntaje en puntos de referencia de IA, superando a Deepseek-R1 en algunas pruebas.
  • Tencent está utilizando sus propios modelos AI y R1 de Deepseek en su plataforma en la nube.

Tencent Holdings ha introducido un nuevo modelo de razonamiento de inteligencia artificial (IA), Hunyuan T1, diseñado para competir con el R1 de Deepseek en rendimiento y asequibilidad.

Presentado el viernes, T1 aprovecha el aprendizaje de refuerzo a gran escala, la misma técnica profunda utilizada en su modelo R1 lanzado en enero .

T1 demuestra el rendimiento de StronG en los puntos de referencia

El lanzamiento oficial sigue una prueba beta de la vista previa de T1 sobre el chatbot de Tencent, Yuanbao. El modelo anotó 87.2 puntos en el punto de referencia PRO de comprensión de lenguaje multitarea masiva (MMLU), superando los 84 puntos de Deepseek-R1 pero que no alcanzan el O1 de OpenAi, que logró 89.3.

T1 también demostró los resultados de StronG en otras evaluaciones, anotando 78.2 en el Examen dematicInvitacional Americana de 2024 (AIME), en comparación con el 79.8 y el 79.2 de O1 de R1. Según Tencent, se destacó en el dominio del idioma chino, anotando 91.8 puntos en la suite C-Eval, coincidiendo con R1 y superando los 87.8 de O1.

El modelo Tencent también rivaliza precios de los precios, lo cual es una ventaja principal para la nueva empresa china popular. T1 cobra 1 yuan ($ 0.14) por 1 millón de tokens de entrada, mientras que la producción cuesta 4 yuanes por millón de tokens.

La tasa de entrada está en línea con R1, que cobra 1 yuan por millón de tokens durante las horas diurnas y solo 0.25 yuanes durante la noche. El precio de salida también es comparable, dada la tasa diurna de R1 de 16 yuanes por millón de tokens, que cae a 4 yuanes durante la noche.

Ver también  S tron G Q1 GIENTOS DE GANANCIMIENTO SHOW TECH GIGANES DESPUÉS

Según Tencent, es el primero en la industria en adoptar una arquitectura híbrida, incluido el transformador de Google, junto con un sistema proporcionado por generadores de la Universidad Carnegie Mellon y la Universidad de Princeton llamado Mamba. Esto reduce significativamente los costos de capacitación e inferencia y optimiza el uso de la memoria durante la capacitación en comparación con una arquitectura totalmente basada en transformadores, según la compañía.

La compañía promueve la T1 como "reduciendo significativamente el consumo de recursos al tiempo que garantiza la capacidad de capturar información de texto larga", lo que permite velocidades de decodificación del 200% más rápidas.

Un ex experto en datos de JD.com escribió el blog de tecnología NCJRYDS y probó T1 y R1 en las mismas tareas. Luego, el individuo solicitó a otros modelos de idiomas grandes, incluidos Claude de Anthrope y ChatGPT de OpenAi, que juzguen los resultados.

El modelo de Tencent perdió el duelo al escribir un antiguo poema chino pero venció a Deepseek al interpretar una palabra china en diferentes contextos.

Otro blog, Goplayai, dio al Tencent Model Four Mathe matic Al preguntas, y después de pasar cinco minutos en él, se equivocó más .

Tencent expande su estrategia de IA con un enfoque de doble núcleo

Tencent, que opera la aplicación de redes sociales más grande de China, WeChat, y el negocio de videojuegos más grande del mundo por ingresos, está posicionando la IA como un nuevo flujo de ingresos básicos. La firma ha integrado Deepseek-R1 en su plataforma en la nube y Yuanbao Chatbot, ofreciendo una alternativa junto con sus propios modelos Hunyuan.

Ver también  la estación de radio australiana utilizó DJ generado por IA durante meses antes de ser descubierto

El presidente y CEO de Tencent, Pony Ma Huateng, señaló recientemente que tenía un gran respeto por Deepseek por hacer "unadentindependiente, verdaderamente de código abierto y producto gratuito".

Ma dijo Tencent ha adoptado una estrategia de "doble núcleo" en la IA que utiliza tanto Deepseek como sus propios modelos Yuanbao. Este enfoque es similar a cómo ha dominado la industria de los videojuegos al promover títulos autodesarrollados y los de Independent Studios.

Academia Cryptopolitan: ¿Cansado de columpios del mercado? Aprenda cómo DeFi puede ayudarlo a generar ingresos pasivos constantes. Registrarse ahora

Compartir enlace:

Descargo de responsabilidad. La información proporcionada no es un consejo comercial. Cryptopolitan.com no asume ninguna responsabilidad por las inversiones realizadas en función de la información proporcionada en esta página. Recomendamos tron dent independiente y/o la consulta con un profesional calificado antes de tomar cualquier decisión de inversión.

Mas leido

Cargando los artículos más leídos...

Manténgase al tanto de las noticias sobre criptomonedas y reciba actualizaciones diarias en su bandeja de entrada

elección del editor

Cargando artículos elegidos por el editor...

- El boletín de cifrado que te mantiene por delante -

Los mercados se mueven rápidamente.

Nos movemos más rápido.

Suscríbase a Cryptopolitan diariamente y obtenga ideas criptográficas oportunas, agudas y relevantes directamente a su bandeja de entrada.

Únete ahora y
nunca te pierdas un movimiento.

Entra. Obtén los hechos.
Adelantarse.

Suscríbete a CryptoPolitan