ÚLTIMAS NOTÍCIAS

Será que ZCash conseguirá sobreviver à crise de oferta que derrubou o ZEC em 53%?

Notícias de 9 minutos atrás
Arthur Hayes afirma 'Eu não comprei' em meio à especulação sobre a transferência de US$ 2 milhões

Notícias de 46 minutos atrás
ZachXBT e o cofundador da BitMEX, Arthur Hayes, se enfrentam devido a uma acusação de "liquidez de saída"

Notícias de 6 de junho de 2026
A Twenty One Capital recupera a composição completa do comitê de auditoria, enquanto a Tether nomeia um diretordent

Notícias de 6 de junho de 2026

SELECIONADO PARA VOCÊ

Robô humanoide chuta criança na barriga durante demonstração na China

6 de junho de 2026 Tecnologia
Japão alerta para o risco de se tornar uma "colônia de IA" devido a polêmica sobre lei de dados

6 de junho de 2026 Tecnologia
O novo robô Proteus da Amazon recebe comandos de voz e percorre os armazéns

6 de junho de 2026 Tecnologia

SEMANALMENTE

MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

A Meta afirma que a previsão de múltiplos tokens triplica a velocidade do modelo de IA

Por

Aamir Sheikh

Tempo de leitura: 2 minutos - 7 de maio de 2024

Um estudo realizado por meta-pesquisadores demonstra que previsões com múltiplos tokens podem aumentar o desempenho dos Modelos de Aprendizagem Linear (LLMs).
A técnica envolve o uso de múltiplas cabeças de saída para fazer previsões simultaneamente.
Não requer custos adicionais de memória ou tempo, pois o processo utiliza a mesma arquitetura básica de inferência.

Treinar modelos de linguagem para prever vários tokens simultaneamente resulta em melhor eficiência de amostragem, afirmam pesquisadores da Meta.

Modelos de linguagem de grande porte, como Llama e ChatGPT, geralmente são treinados para a previsão do próximo token, mas com essa nova abordagem, é possível alcançar um desempenho melhor.

O que é a técnica de previsão de token único?

A técnica de predição multi-token oferece uma vantagem significativa em alguns cenários, com velocidade três vezes maior que a de tarefas generativas, mas ainda não é uma solução universal para todos os tipos de modelo. A técnica ainda tem bastante espaço para melhorias e, para algumas aplicações de aprendizado de máquina, pode se tornar uma ferramenta robusta.

Para uma compreensão mais clara, pode-se dizer que o processo tradicional de treinamento de LLM utiliza uma abordagem chamada "previsão do próximo token", na qual o modelo prevê apenas o próximo token em uma determinada sequência.

Em um processo automatizado, o token previsto é adicionado à entrada, e o processo é repetido diversas vezes ao longo de todo o texto fornecido, para que o modelo aprenda os padrões comuns e desenvolva a capacidade de produzir uma saída composta por texto lógico e consistente.

Essa técnica apresenta algumas desvantagens, pois, ao processar apenas o próximo token, o modelo fica muito focado nos padrões locais do texto e ignora as previsões que só podem ser feitas por meio do raciocínio.

Outro problema dessa técnica é que ela exige enormes quantidades de dados para alimentar o modelo e alcançar o fluxo normal de produção de linguagem que os humanos conseguem com muito pouco texto.

A previsão de múltiplos tokens permite uma velocidade 3 vezes maior

Na nova abordagem de múltiplos tokens sugerida por Meta, o LLM é instruído a prever múltiplos tokens de diferentes posições simultaneamente durante o processo de treinamento. Os pesquisadores utilizaram uma arquitetura de predição simples para a predição de múltiplos tokens, que não requer recursos adicionais como tempo e memória de processamento.

Os pesquisadores utilizaram a mesma arquitetura Transformer já usada pela maioria dos LLMs, mas fizeram algumas alterações para acomodar a previsão de múltiplos tokens, aumentando o número de cabeçalhos de saída de único para múltiplos e alocando um para cada token.

Dessa forma, para tirar conclusões e fazer previsões, o modelo utiliza a mesma estratégia básica de previsão subsequente, mas, ao empregar múltiplas cabeças, consegue acelerar o processo. O estudo de pesquisa afirma:

“Embora seja gratuita e simples, a previsão com múltiplos tokens é uma modificação eficaz para treinar modelos Transformertrone rápidos.”
Fonte: Meta.

Durante o estudo, os pesquisadores descobriram que a técnica produzia resultados abaixo do esperado quando usada em modelos menores, mas os resultados melhoravam em relação à média quando o mesmo processo era aplicado a modelos maiores, e continuavam a melhorar com o tamanho do modelo. Como afirma o estudo,

“O método é cada vez mais útil para modelos de tamanhos maiores e mantém seu atrativo mesmo em treinamentos com múltiplas épocas. Os ganhos são especialmente expressivos em benchmarks generativos, como programação, onde nossos modelos consistentemente superam linhas de basetronem vários pontos percentuais.”
Fonte: Meta.

Os pesquisadores também afirmaram que a técnica de previsão de múltiplos tokens torna o modelo três vezes mais rápido na produção de resultados lógicos, o que é útil com a vantagem de não haver custo adicional ou de um custo adicional muito baixo.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Aamir Sheikh

Aamir é um jornalista de tecnologia com quase seis anos de experiência nos setores de criptomoedas e tecnologia. Ele se formou na MAJ University com um MBA em Finanças e Marketing. Atualmente, trabalha na Cryptopolitan, onde reporta sobre os últimos acontecimentos nos mercados de criptomoedas e previsões de preços.

ÍNDICE

1. O que é a técnica de previsão de token único?

2. A previsão de múltiplos tokens permite uma velocidade 3 vezes maior

Compartilhe este artigo

MAIS… NOTÍCIAS

MOSTRAR TUDO

5 aplicações engenhosas do ChatGPT e o que você deve fazer a respeito

Há 3 anos, John Palmer, da área de tecnologia

93% dos líderes empresariais preferem soluções baseadas em IA para a gestão da sustentabilidade da marca, segundo a Reuters

Há 3 anos, John Palmer, da área de tecnologia

Eis como Macron apoia o ecossistema de IA vibrante e produtivo da França

Há 3 anos, Tech Glory Kaburu

A Bloomberg estima que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032

3 anos atrás, Aamir Sheikh, da área de tecnologia

O que é Base? A rede Ethereum de camada 2 lançada pela Coinbase

21 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Dogecoin vs. Bitcoin: Principais Diferenças Técnicas

20 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é TVL (Valor Total Bloqueado) em criptomoedas?

14 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Como ler um white paper de criptomoedas?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Ripple vs. XRP vs. XRP Ledger: Qual a diferença?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é uma carteira multisig em criptomoedas?

10 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes

CURSO INTENSIVO DE CRIPTOMOEDAS AVANÇADAS

Quais criptomoedas podem te fazer ganhar dinheiro?
Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
Estratégias de investimento pouco conhecidas que os profissionais utilizam
Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)