ÚLTIMAS NOTÍCIAS
SELECIONADO PARA VOCÊ
SEMANALMENTE
MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

Gigantes chinesas da tecnologia integram o modelo de IA Llama 3.1 da Meta em serviços de nuvem

PorBrenda KananaBrenda Kanana
Tempo de leitura: 2 minutos
Gigantes chinesas da tecnologia integram o modelo de IA Llama 3.1 da Meta em serviços de nuvem
  • A Alibaba Cloud e a Tencent Holdings adotaram rapidamente o novo modelo de IA da Meta Platforms, o Llama 3.1.
  • O CEO da Meta, Mark Zuckerberg, descreve o Llama 3.1 como um modelo de IA de código aberto líder de mercado.
  • Zuckerberg afirma que o Llama 3.1 supera outros, como o GPT-4 da OpenAI.

As gigantes chinesas de tecnologia Alibaba Group Holding e Tencent Holdings integraram rapidamente o modelo de IA mais recente da Meta Platforms, o Llama 3.1, em seus serviços em nuvem. O lançamento do Llama 3.1 atraiu bastante atenção, impulsionando sua rápida adoção por essas empresas líderes.

Leia também:  Elon Musk anuncia treinamento GROK 3 em Memphis com GPUs NVIDIA H100

A Alibaba Cloud, o braço de computação em nuvem da empresa de comércio eletrônico, foi uma das primeiras a implementar o novo modelo Llama. A integração à sua plataforma de treinamento de modelos Bailian foi revelada por meio da conta oficial da Alibaba no WeChat. A empresa está oferecendo um mês de recursos computacionais para treinamento e inferência no Llama 3.1, ressaltando o valor do modelo. 

A Tencent segue o exemplo e aprimora as capacidades do modelo

O Llama 3.1, o membro mais recente da família de modelos de linguagem de código aberto Llama (LLMs), impulsiona aplicações de IA generativa como o ChatGPT. Após o anúncio do Alibaba, a Tencent Holdings, sediada em Shenzhen, rapidamente seguiu o exemplo. A abordagem da Tencent também envolve o aprimoramento do ajuste fino e da inferência do modelo para maior flexibilidade em diversas tarefas, como conversação, geração de texto e escrita. 

A Meta Platforms criou os modelos Llama e os dividiu em três tamanhos: Llama 8B, 70B e 450B, sendo os números referentes à quantidade de parâmetros. A quantidade de parâmetros é um dos fatores essenciais que determinam a capacidade do LLM, pois mais parâmetros significam maior capacidade.

Zuckerberg posiciona o Llama 3.1 como uma fronteira do código aberto

O CEO da Meta, Mark Zuckerberg, enfatizou que a "inovação descentralizada e aberta" é benéfica no atual contexto de espionagem e roubo de modelos. Ele afirmou que a "inovação descentralizada e aberta" é benéfica para os EUA e revelou que os futuros modelos da Lhama serão os melhores do mercado a partir do próximo ano.

Zuckerberg afirmou que os futuros modelos do Llama reduzirão essa diferença entre o código aberto e os melhores modelos proprietários atualmente disponíveis no mercado. Ele afirmou ainda que os modelos do Llama serão os mais sofisticados do mercado até o final do próximo ano.  

O Llama 3.1 tem recebido muita atenção entre as startups chinesas, pois estas utilizam os modelos do Llama como base para a criação de aplicações de IA generativa. No entanto, existem alguns céticos no setor que desaconselham o uso excessivo dos modelos da Meta. O caso do unicórnio chinês de IA é um exemplo dessa tecnologia. 

Atualmente, a LMSYS, um órgão de pesquisa de modelos de IA afiliado à Universidade da Califórnia, Berkeley, colocou os modelos proprietários da OpenAI, Anthropic e Google na vanguarda. O GPT-4 da OpenAI está na primeira posição, enquanto os modelos dessas empresas ocupam as dez primeiras posições. 

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Brenda Kanana

Brenda Kanana

Brenda possui mais de 4 anos de experiência especializada em criptomoedas, inteligência artificial e tecnologias emergentes. Ela trabalhou na Zycrypto, Blockchain Reporter, The Coin Republic e agora, na Cryptopolitan , é sua casa. Sua formação em Sociologia pela Universidade Técnica de Mombasa a mantém em sintonia com o que seus leitores desejam.

MAIS… NOTÍCIAS
CURSO INTENSIVO DE CRIPTOMOEDAS AVANÇADAS