ÚLTIMAS NOTÍCIAS
SELECIONADO PARA VOCÊ
SEMANALMENTE
MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

Meituan disponibiliza em código aberto o modelo de IA LongCat-2.0, com 1,6 trilhão de parâmetros, treinado em chips chineses

PorRanda MosesRanda Moses
Leitura de 2 minutos,
Meituan disponibiliza em código aberto o modelo de IA LongCat-2.0, com 1,6 trilhão de parâmetros, treinado em chips chineses.
  • A Meituan lançou o LongCat-2.0, um modelo de IA de código aberto com 1,6 trilhão de parâmetros, treinado em chips chineses.
  • Este lançamento comprova que as empresas chinesas podem criar modelos em escala de vanguarda sem depender de hardware ocidental limitado.
  • Isso ocorre em um momento em que as restrições à exportação estão incentivando a autossuficiência em hardware no setor de tecnologia da China.

A Meituan afirma ter treinado seu modelo de 1,6 trilhão de parâmetros em hardware chinês, evitando completamente o uso de GPUs da Nvidia. A empresa é a maior plataforma da China para serviços locais e entrega de comida.

O lançamento ocorre em um momento em que os controles de exportação dos EUA continuam a remodelar a forma como as empresas chinesas desenvolvem IA em larga escala. A Meituan treinou o LongCat-2.0 em superpods ASIC nacionais. A empresa apresenta o modelo como prova de que as empresas chinesas podem atingir escala de ponta sem os chips baseados em CUDA da Nvidia.

O LongCat-2.0 opera com uma arquitetura esparsa que combina conhecimentos de diversas áreas

O LongCat-2.0 utiliza uma arquitetura esparsa de mistura de especialistas. O DeepSeek e o Mixtral da Mistral usam essa mesma abordagem abrangente. Em vez de disparar simultaneamente todos os 1,6 trilhão de parâmetros, um roteador interno seleciona um subconjunto de submodelos especializados para cada token. Comparado a um modelo denso do mesmo tamanho, esse design mantém os custos de inferência baixos.

O modelo é fornecido com uma janela de contexto de um milhão de tokens. Tanto o DeepSeek-R1-0528 quanto o GPT-OSS da OpenAI têm um valor máximo de token de 128.000. Nos benchmarks publicados, a Meituan comparou o LongCat-2.0 com modelos proprietários do Google, da OpenAI e da Anthropic. Até o momento, essas afirmações não foram validadas por avaliações imparciais de terceiros.

A Meituan desenvolveu o LongCat-2.0 para servir como o principal mecanismo de raciocínio para agentes de IA e ferramentas de codificação. A empresa apontou a compreensão de código, edições em todo o repositório e execução automatizada de tarefas como casos de uso principais.

A Bernstein estima que a Nvidia detém 40% do mercado de chips de IA da China

Uma estimativa da empresa de pesquisa de ações Bernstein para 2025 colocou a participação da Nvidia no mercado chinês de chips de inteligência artificial em cerca de 40%. A Huawei tem uma porcentagem semelhante. A Bernstein previu que a Huawei ganharia terreno este ano, fazendo com que a participação da Nvidia caísse 8 pontos percentuais.

Quanto aos clusters ASIC domésticos, a Meituan afirma ter treinado e otimizado o LongCat-2.0. Isso significa que o modelo não precisa do conjunto de software da Nvidia e pode, em vez disso, ser executado em hardware já existente na China. Em vez de configurações fragmentadas de terceiros, os "superpods" implicam em hardware de nível empresarial totalmente integrado.

Nem os dispositivos de consumo nem a maioria dos sistemas locais serão capazes de lidar com os 1,6 trilhão de parâmetros do LongCat-2.0. Ele reside em data centers, distribuídos em clusters de inferência de alta densidade que utilizam paralelismo de modelos.

A entrega de refeições é o carro-chefe da Meituan, não o desenvolvimento de inteligência artificial de ponta. Ao adquirir a startup de IA Light Year Beyond por US$ 281 milhões em 2023, a empresa de Pequim entrou no setor de IA. Segundo o SiliconANGLE, seus planos para o desenvolvimento de modelos internos só foram anunciados publicamente em 2025.

A MiniMax, outra startup chinesa de IA, recebeu apoio da Alibaba e da miHoYo. De acordo com reportagens da Cryptopolitan, esses investidores se comprometeram a não vender ações antes do término do período de bloqueio, em 9 de julho.

De acordo com Cai Lian She, citado pela Cryptopolitan, a MiniMax lançou seu próprio modelo de contexto de um milhão de tokens, o M3, no início de junho de 2026. A MiniMax introduziu preços significativamente mais baixos do que os dos líderes de mercado nos Estados Unidos.

Testesdent determinarão o quão seriamente os desenvolvedores fora da China levarão o LongCat-2.0. A otimização para chips nacionais pode limitar o desempenho em hardware da Nvidia, que ainda domina os data centers em todo o mundo. A arquitetura de raciocínio principal, segundo o Meituan, permanece portátil.

Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.

Perguntas frequentes

O que é LongCat-2.0?

O LongCat-2.0 é um modelo de linguagem de código aberto com 1,6 trilhão de parâmetros, desenvolvido pela Meituan, que utiliza uma arquitetura esparsa de mistura de especialistas e oferece uma janela de contexto de 1 milhão de tokens.

Por que o treinamento com chips domésticos é importante?

A Meituan afirma ter treinado o LongCat-2.0 inteiramente em clusters ASIC fabricados na China, demonstrando que modelos de IA de ponta podem ser construídos sem GPUs da Nvidia.

Como o LongCat-2.0 se compara a outros modelos de IA?

Os testes de desempenho publicados pela Meituan a colocam ao lado de modelos de código fechado do Google, OpenAI e Anthropic, embora a verificaçãodent ainda esteja pendente.

Compartilhe este artigo
Randa Moses

Randa Moses

Randa Moses é editora e repórter da Cryptopolitan onde cobre tecnologia, IA, robótica, criptomoedas, golpes e ataques cibernéticos. Ela trabalha no universo das criptomoedas desde 2017, tendo atuado na Forward Protocol, AmaZix e Cryptosomniac. Randa é formada em Engenharia Elétrica etronpela Universidade de Bradford.

MAIS… NOTÍCIAS
CURSO INTENSIVO DE CRIPTOMOEDAS AVANÇADAS