ÚLTIMAS NOTICIAS

¿Podrá ZCash sobrevivir al pánico por la escasez de suministro que provocó una caída del 53% en su valor?

Hace 9 minutos Noticias
Arthur Hayes declara "No compré" en medio de la transferencia de HYPE por valor de 2 millones de dólares

Hace 46 minutos Noticias
ZachXBT y Arthur Hayes, cofundador de BitMEX, se enfrentan por una acusación de "liquidez de salida"

Noticias del 6 de junio de 2026
Twenty One Capital recupera la composición completa de su comité de auditoría mientras Tether nombra a un directordent

Noticias del 6 de junio de 2026

SELECCIONADO PARA TI

Un robot humanoide patea a un niño en el estómago durante una demostración en China

6 de junio de 2026 Tecnología
Japón advierte de convertirse en una "colonia de IA" mientras la ley de datos desata una polémica

6 de junio de 2026 Tecnología
El nuevo robot Proteus de Amazon recibe comandos de voz y recorre los almacenes

6 de junio de 2026 Tecnología

SEMANALMENTE

MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

La predicción multitoken triplica la velocidad del modelo de IA, afirma Meta

Por

Aamir Sheikh

Lectura de 2 minutos. 7 de mayo de 2024.

Un estudio de investigación realizado por metainvestigadores muestra que las predicciones de múltiples tokens pueden aumentar el rendimiento de los LLM.
La técnica implica el uso de múltiples cabezales de salida para realizar predicciones simultáneamente.
No requiere ningún coste adicional en memoria ni tiempo, ya que el proceso utiliza la misma arquitectura de inferencia básica.

Según investigadores de Meta, entrenar modelos de lenguaje para predecir múltiples tokens a la vez da como resultado una mejor eficiencia de muestreo.

Los modelos de lenguaje grandes como Llama y ChatGPT generalmente se entrenan para la próxima predicción de token, pero con este nuevo enfoque, se puede lograr un mejor rendimiento.

¿Qué es la técnica de predicción de token único?

La técnica de predicción multitoken ofrece una ventaja significativa en algunos escenarios, triplicando la velocidad de las tareas generativas. Sin embargo, aún no es una solución universal para todo tipo de modelo. La técnica tiene un amplio margen de mejora y, para algunas aplicaciones LLM, puede convertirse en una herramienta robusta.

Para una comprensión más clara, se puede decir que el proceso tradicional para el entrenamiento LLM utiliza un enfoque llamado “predicción del próximo token” y, de esta manera, un modelo predice solo el próximo token futuro en una secuencia dada.

En un proceso automatizado, el token predecido se agrega a la entrada y el proceso se repite una y otra vez en todo el texto de entrada proporcionado para que el modelo aprenda los patrones comunes y desarrolle la capacidad de producir una salida que consista en texto lógico y consistente.

Esta técnica tiene algunas desventajas, ya que al procesar solo el siguiente token, el modelo se centra demasiado en los patrones locales del texto e ignora las predicciones que solo se pueden hacer con el razonamiento.

Otro problema con esta técnica es que requiere introducir enormes cantidades de conjuntos de datos en el modelo para alcanzar el flujo normal de salida de lenguaje que los humanos pueden hacer con muy poco texto.

La predicción de múltiples tokens permite una velocidad tres veces mayor

En el nuevo enfoque multitoken sugerido por Meta, el LLM debe predecir múltiples tokens desde diferentes posiciones simultáneamente durante el proceso de entrenamiento. Los investigadores utilizaron una arquitectura de predicción simple para la predicción multitoken que no requiere recursos adicionales como tiempo y procesamiento de memoria.

Los investigadores utilizaron la misma arquitectura Transformer que ya utilizan la mayoría de los LLM, pero realizaron algunos cambios para dar cabida a la predicción de múltiples tokens incrementando sus cabezales de salida de uno a varios y asignando uno a cada token.

De esta manera, para extraer conclusiones y hacer predicciones, el modelo utiliza la misma estrategia básica de predicción siguiente, pero al utilizar múltiples cabezas, puede acelerar el proceso. El estudio de investigación afirma:

“Si bien es gratuita y sencilla, la predicción de múltiples tokens es una modificación eficaz para entrenar modelos de transformadorestrony rápidos”
Fuente: Meta.

Los investigadores descubrieron durante el estudio que la técnica producía resultados inferiores al aplicarla en modelos más pequeños, pero que los resultados superaban la media al aplicar el mismo proceso a modelos más grandes, y que los resultados seguían mejorando con el tamaño del modelo. Según el estudio,

El método es cada vez más útil para modelos de mayor tamaño y mantiene su atractivo al entrenar para múltiples épocas. Las mejoras son especialmente pronunciadas en parámetros generativos como la codificación, donde nuestros modelos superan consistentemente las líneas basetronpor varios puntos porcentuales
Fuente: Meta.

Los investigadores también dijeron que la técnica de predicción de múltiples tokens también hace que el modelo sea tres veces más rápido en producir resultados lógicos, lo que es útil con el beneficio de no tener ningún costo adicional o tener muy poco.

Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Aamir Sheikh

Aamir es periodista especializado en tecnología con casi seis años de experiencia en los sectores de criptomonedas y tecnología. Se graduó de la Universidad MAJ con un MBA en Finanzas y Marketing. Actualmente trabaja en Cryptopolitan, donde informa sobre las últimas novedades en los mercados de criptomonedas y realiza predicciones de precios.

ÍNDICE

1. ¿Qué es la técnica de predicción de token único?

2. La predicción de múltiples tokens permite una velocidad tres veces mayor

Comparte este artículo

MÁS… NOTICIAS

MOSTRAR TODO

5 ingeniosas aplicaciones de ChatGPT y qué debes hacer al respecto

Hace 3 años, el técnico John Palmer

El 93% de los líderes empresariales prefieren soluciones basadas en IA para la gestión de la sostenibilidad de la marca, según Reuters

Hace 3 años, el técnico John Palmer

El ecosistema de inteligencia artificial de Francia

Así apoya Macron el vibrante y productivo ecosistema de IA de Francia

Hace 3 años Tech Glory Kaburu

Bloomberg estima que el mercado de IA generativa alcanzará los 1,3 billones de dólares en 2032

Hace 3 años, Tech Aamir Sheikh

¿Qué es Base? La red de capa 2 Ethereum lanzada por Coinbase

21 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Dogecoin vs. Bitcoin: Diferencias técnicas clave

20 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es TVL (valor total bloqueado) en criptomonedas?

14 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Cómo leer un documento técnico sobre criptomonedas?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Ripple vs. XRP vs. XRP Ledger: ¿Cuál es la diferencia?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es una billetera multifirma en criptomonedas?

10 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes

CURSO INTENSIVO DE CRIPTOMONEDAS PROFUNDAS

¿Qué criptomonedas pueden hacerte ganar dinero?
Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
Estrategias de inversión poco conocidas que utilizan los profesionales
Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)