ÚLTIMAS NOTÍCIAS
SELECIONADO PARA VOCÊ
SEMANALMENTE
MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

DeepSeek revela novo método de raciocínio de IA em meio à expectativa pelo seu modelo de próxima geração

PorOwotunse AdebayoOwotunse Adebayo
Tempo de leitura: 3 minutos
Deepseek revela novo método de raciocínio de IA em meio à expectativa pelo seu modelo de próxima geração.
  • A startup chinesa de inteligência artificial DeepSeek revelou um novo método de raciocínio de IA, enquanto o mercado aguarda ansiosamente seu modelo de próxima geração.
  • A DeepSeek revela um novo método de raciocínio de IA, enquanto a empresa mantém silêncio sobre um possível lançamento do modelo R2.
  • A startup chinesa de IA tem se concentrado em pesquisa e desenvolvimento, lançando a versão atualizada de seu modelo V3.

A startup chinesa de inteligência artificial (IA), DeepSeek, revelou um novo método de raciocínio enquanto o mercado aguarda ansiosamente o lançamento de seu modelo de próxima geração. Segundo relatos, a empresa acaba de apresentar uma nova abordagem que aprimorará as capacidades de raciocínio de grandes modelos de linguagem (LLMs), enquanto o público aguarda o lançamento do novo modelo.

Segundo relatos, um artigo publicado recentemente revelou que o feito foi alcançado por meio de uma colaboração entre pesquisadores da Universidade de Tsinghua e a startup de IA DeepSeek. De acordo com o artigo, a DeepSeek conseguiu desenvolver uma técnica que combina métodos conhecidos como modelagem generativa de recompensa (GRM) e ajuste baseado em princípios. Essa abordagem dupla permitirá que os modelos de aprendizado de máquina (LLMs) forneçam resultados melhores e mais rápidos para consultas gerais.

DeepSeek revela novo método de raciocínio de IA

Segundo os pesquisadores, os modelos DeepSeek-GRM resultantes superaram os métodos existentes, alcançando um desempenho competitivo com modelos de recompensa públicostron. A modelagem de recompensa é um processo que auxilia um modelo de aprendizagem de linguagem (LLM) a determinar as preferências humanas. Os pesquisadores mencionaram que a startup de IA pretende disponibilizar os modelos GRM em código aberto, mas a empresa ainda não divulgou um cronograma para o desenvolvimento.

O artigo acadêmico publicado surge após especulações sobre o possível próximo passo da startup, que enjatenção global graças ao seu modelo fundamental DeepSeek V3 e ao seu modelo de raciocínio R1. Na época, o modelo R1, lançado no início deste ano, ganhou destaque após apresentar desempenho superior a alguns modelos mais antigos, incluindo o primeiro modelo ChatGPT da OpenAI.

O lançamento do modelo R1 também pegou o Vale do Silício de surpresa, considerando que o modelo era de código aberto e foi concluído com uma fração dos custos utilizados em outros modelos de IA. Embora a atenção pareça estar diminuindo, houve um progresso notável entre as empresas rivais no setor de IA, mostrando que a rivalidade no setor é daquelas que vêm se mantendo vivas.

No entanto, uma reportagem da Reuters do mês passado mencionou que o DeepSeek-2, sucessor do mundialmente aclamado R1, pode estar em desenvolvimento. Segundo a reportagem, a empresa poderia lançá-lo no final deste mês, buscando capitalizar sua crescente visibilidade no setor de IA. A DeepSeek, por outro lado, tem se mantido discreta sobre o modelo R2, sem se pronunciar em seus canais oficiais, e o serviço de atendimento ao cliente chegou a negar o rumor a clientes corporativos, de acordo com relatos.

O desenvolvimento do modelo V3 continua

A DeepSeek, sediada em Hangzhou, foi fundada em 2023 pelo empreendedor Liang Wenfeng e tem estado no centro das atenções globais nos últimos meses, pelos melhores motivos. No entanto, a empresa tem optado por não fazer comunicados públicos, decidindo concentrar todo o seu tempo e energia em pesquisa e desenvolvimento. Embora ainda seja incerto o que a empresa reserva para a indústria de IA, certamente, a julgar pelos rumores, ela está em plena atividade.

No mês passado, a empresa anunciou um desenvolvimento no qual vinha trabalhando, apresentando ao mundo seu modelo V3 atualizado, denominado DeepSeek-V3-0324. Segundo a empresa, o modelo atualizado oferece “capacidades de raciocínio aprimoradas, desenvolvimento web front-end otimizado e proficiência aprimorada em escrita chinesa”. Em fevereiro, a empresa terceirizou cinco de seus repositórios de código, permitindo que desenvolvedores revisassem e contribuíssem para o desenvolvimento de seu software. A startup mencionou que faria “progressos sinceros com total transparência”

No mesmo mês, Liang publicou um estudo técnico sobre atenção esparsa nativa, um método usado para melhorar a eficiência dos Modelos de Aprendizado de Máquina (LLMs) no processamento de grandes quantidades de dados. Liang, de 40 anos, também é o fundador da High-Flyer Quant, empresa controladora da DeepSeek, o fundo de hedge que forneceu o poderio financeiro para financiar os avanços técnicos da startup de IA. No final de fevereiro, o empreendedor participou de um simpósio que reuniu empreendedores de tecnologia, com a presença do presidente chinêsdent Jinping. O presidentedent a startup como um sinal da resiliência do país diante das medidas dos Estados Unidos para conter o progresso da IA ​​na China.

Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Owotunse Adebayo

Owotunse Adebayo

Adebayo é um escritor com quatro anos de experiência no universo das criptomoedas. Ele se formou na Universidade de Lagos, onde estudou Planejamento Urbano e Regional. Adebayo trabalhou na Tokenhell e na CryptoTicker, escrevendo notícias sobre criptomoedas e fintechs. Atualmente, ele é colaborador do Cryptopolitan.

MAIS… NOTÍCIAS
INTENSIVO AVANÇADAS
CURSO