Your bank is using your money. You’re getting the scraps.WATCH FREE

DeepSeek amplia sua visão à medida que a cadeia de suprimentos de chips da China demonstra que finalmente consegue acompanhar o ritmo

Neste post:

  • A DeepSeek adicionou visão computacional ao seu chatbot e lançou um novo modelo principal, o V4.
  • Pela primeira vez, quatro fabricantes chineses de chips igualaram a compatibilidade da Nvidia no dia do lançamento.
  • A competição em IA está mudando, passando do desempenho do modelo para a independência de custo e hardware.

Uma empresa chinesa de inteligência artificial adicionou reconhecimento de imagem e vídeo ao seu chatbot principal.

Ao mesmo tempo, os fabricantes locais de chips mostraram que agora conseguem igualar o suporte de lançamento rápido que costumava ser um ponto forte dos Estados Unidos.

A DeepSeek, empresa sediada em Hangzhou, adicionou discretamente um novo recurso chamado "modo de reconhecimento de imagem" à sua plataforma de bate-papo. Este novo modo se junta a outros dois lançados pela empresa no início deste mês: "especialista" e "flash"

O novo recurso permite que o chatbot entenda fotos e vídeos, e não apenas texto.

Isso o alinha a outros chatbots de IA importantes que oferecem funcionalidades semelhantes há algum tempo.

Chen Xiaokang, que lidera a equipe multimodal da DeepSeek, disse que a ferramenta foi testada inicialmente com um pequeno grupo de usuários, tanto no site quanto no aplicativo móvel.

Chen Deli, pesquisador sênior da empresa, comemorou o lançamento com uma breve publicação que fazia referência ao logotipo da empresa: "A pequena baleia agora consegue enxergar".

O recurso de imagem e vídeo foi lançado poucos dias depois de a DeepSeek divulgar uma prévia de seu mais novo modelo principal, o DeepSeek-V4, e disponibilizar os pesos do modelo para download e uso por qualquer pessoa.

O V4 não é um modelo único, mas sim dois. O primeiro, DeepSeek-V4-Pro, possui 1,6 trilhão de parâmetros e foi projetado para tarefas complexas que exigem raciocínio sofisticado e fluxos de trabalho automatizados com várias etapas.

Veja também:  Associação de Editores insta o Reino Unido a reforçar a legislação de propriedade intelectual antes da Cúpula Global de IA

O segundo modelo, DeepSeek-V4-Flash, foi desenvolvido para lidar com um grande número de solicitações a um custo menor. Ambos os modelos suportam uma janela de contexto de um milhão de tokens.

Eles também utilizam um design de atenção híbrido que, segundo a empresa, reduz a capacidade de processamento e a memória necessárias durante a inferência.

Fabricantes chineses de chips atingem um novo marco

O que chamou a atenção de muitos observadores do setor não foi apenas o modelo em si, mas o que aconteceu no dia do seu lançamento.

Quatro empresas chinesas de chips, Huawei Ascend, Cambricon, Hygon Information e Moore Threads, confirmaram que seus hardwares funcionaram perfeitamente com a versão 4 desde o primeiro dia de seu lançamento.

Esse tipo de suporte no mesmo dia, em que um novo modelo funciona perfeitamente em chips que não são da NVIDIA logo no lançamento, em vez de semanas ou meses depois, era praticamente impossível fora do próprio ecossistema da Nvidia.

Os chips Ascend da Huawei, incluindo o A2, A3 e 950, são compatíveis com V4-Pro e V4-Flash.

A empresa afirmou que seu chip Ascend 950 utiliza processos de computação combinada e fluxos de processamento paralelo para tornar a inferência mais rápida.

A Cambricon concluiu sua adaptação usando a estrutura de inferência de código aberto vLLM e compartilhou seu código no GitHub.

A Hygon afirmou ter realizado uma otimização profunda do modelo em sua plataforma DCU para criar um caminho tranquilo desde o lançamento do modelo até o uso real.

A Moore Threads colaborou com a Academia de Inteligência Artificial de Pequim para executar a versão 4 em sua placa MTT S5000 usando o pacote de software FlagOS.

Veja também:  Nvidia afirma ter corrigido falhas em seus chips de IA Blackwell.

Observadores do setor afirmam que esse lançamento coordenado representa uma mudança real.

Durante anos, os chips fabricados fora do ecossistema da Nvidia levavam meses para serem compatíveis com um novo modelo importante. Conseguir que oito chipsets nacionais diferentes funcionassem no primeiro dia é um marco significativo.

Em termos gerais: custo e independência para a Deepseek

Observadores acreditam que o significado mais importante deste lançamento é que a DeepSeek demonstrou ser capaz de fornecer IA de alto nível sem depender de hardware ocidental.

Ao fazer com que seus modelos funcionem nativamente em vários chips chineses simultaneamente, a empresa reduz o risco decorrente das restrições de exportação que impediram as empresas chinesas de acessar os processadores americanos mais poderosos.

O custo também é importante. A DeepSeek se esforçou para manter o preço de execução de seus modelos baixo. Isso facilita para as empresas a criação de sistemas automatizados sem que precisem arcar com custos computacionais muito elevados.

Dessa forma, as atualizações e o lançamento do Deepseek não se resumem a um único avanço técnico. Trata-se, sobretudo, da convergência de toda uma cadeia de suprimentos.

A partir deste lançamento, a questão de quem lidera em IA parece estar deixando de ser quem constrói o modelo mais inteligente e passando a ser quem consegue manter todo o sistema funcionando de forma barata edenta longo prazo.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Compartilhar link:

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrondentdentdentdentdentdentdentdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Mais lidas

Carregando os artigos mais lidos...

Fique por dentro das notícias sobre criptomoedas e receba atualizações diárias na sua caixa de entrada

Escolha do editor

Carregando artigos selecionados pela equipe editorial...

- A newsletter de criptomoedas que te mantém sempre um passo à frente -

Os mercados se movem rapidamente.

Nós nos movemos mais rápido.

Assine o Cryptopolitan Daily e receba informações oportunas, precisas e relevantes sobre criptomoedas diretamente na sua caixa de entrada.

Inscreva-se agora e
não perca nenhum lance.

Entre. Informe-se.
Saia na frente.

Inscreva-se no CryptoPolitan