DeepSeek revela novo método de raciocínio de IA em meio à expectativa pelo seu modelo de próxima geração

- A startup chinesa de inteligência artificial DeepSeek revelou um novo método de raciocínio de IA, enquanto o mercado aguarda ansiosamente seu modelo de próxima geração.
- A DeepSeek revela um novo método de raciocínio de IA, enquanto a empresa mantém silêncio sobre um possível lançamento do modelo R2.
- A startup chinesa de IA tem se concentrado em pesquisa e desenvolvimento, lançando a versão atualizada de seu modelo V3.
A startup chinesa de inteligência artificial (IA), DeepSeek, revelou um novo método de raciocínio enquanto o mercado aguarda ansiosamente o lançamento de seu modelo de próxima geração. Segundo relatos, a empresa acaba de apresentar uma nova abordagem que aprimorará as capacidades de raciocínio de grandes modelos de linguagem (LLMs), enquanto o público aguarda o lançamento do novo modelo.
Segundo relatos, um artigo publicado recentemente revelou que o feito foi alcançado por meio de uma colaboração entre pesquisadores da Universidade de Tsinghua e a startup de IA DeepSeek. De acordo com o artigo, a DeepSeek conseguiu desenvolver uma técnica que combina métodos conhecidos como modelagem generativa de recompensa (GRM) e ajuste baseado em princípios. Essa abordagem dupla permitirá que os modelos de aprendizado de máquina (LLMs) forneçam resultados melhores e mais rápidos para consultas gerais.
DeepSeek revela novo método de raciocínio de IA
Segundo os pesquisadores, os modelos DeepSeek-GRM resultantes superaram os métodos existentes, alcançando um desempenho competitivo com modelos de recompensa públicostron. A modelagem de recompensa é um processo que auxilia um modelo de aprendizagem de linguagem (LLM) a determinar as preferências humanas. Os pesquisadores mencionaram que a startup de IA pretende disponibilizar os modelos GRM em código aberto, mas a empresa ainda não divulgou um cronograma para o desenvolvimento.
O artigo acadêmico publicado surge após especulações sobre o possível próximo passo da startup, que enjatenção global graças ao seu modelo fundamental DeepSeek V3 e ao seu modelo de raciocínio R1. Na época, o modelo R1, lançado no início deste ano, ganhou destaque após apresentar desempenho superior a alguns modelos mais antigos, incluindo o primeiro modelo ChatGPT da OpenAI.
O lançamento do modelo R1 também pegou o Vale do Silício de surpresa, considerando que o modelo era de código aberto e foi concluído com uma fração dos custos utilizados em outros modelos de IA. Embora a atenção pareça estar diminuindo, houve um progresso notável entre as empresas rivais no setor de IA, mostrando que a rivalidade no setor é daquelas que vêm se mantendo vivas.
No entanto, uma reportagem da Reuters do mês passado mencionou que o DeepSeek-2, sucessor do mundialmente aclamado R1, pode estar em desenvolvimento. Segundo a reportagem, a empresa poderia lançá-lo no final deste mês, buscando capitalizar sua crescente visibilidade no setor de IA. A DeepSeek, por outro lado, tem se mantido discreta sobre o modelo R2, sem se pronunciar em seus canais oficiais, e o serviço de atendimento ao cliente chegou a negar o rumor a clientes corporativos, de acordo com relatos.
O desenvolvimento do modelo V3 continua
A DeepSeek, sediada em Hangzhou, foi fundada em 2023 pelo empreendedor Liang Wenfeng e tem estado no centro das atenções globais nos últimos meses, pelos melhores motivos. No entanto, a empresa tem optado por não fazer comunicados públicos, decidindo concentrar todo o seu tempo e energia em pesquisa e desenvolvimento. Embora ainda seja incerto o que a empresa reserva para a indústria de IA, certamente, a julgar pelos rumores, ela está em plena atividade.
No mês passado, a empresa anunciou um desenvolvimento no qual vinha trabalhando, apresentando ao mundo seu modelo V3 atualizado, denominado DeepSeek-V3-0324. Segundo a empresa, o modelo atualizado oferece “capacidades de raciocínio aprimoradas, desenvolvimento web front-end otimizado e proficiência aprimorada em escrita chinesa”. Em fevereiro, a empresa terceirizou cinco de seus repositórios de código, permitindo que desenvolvedores revisassem e contribuíssem para o desenvolvimento de seu software. A startup mencionou que faria “progressos sinceros com total transparência”
No mesmo mês, Liang publicou um estudo técnico sobre atenção esparsa nativa, um método usado para melhorar a eficiência dos Modelos de Aprendizado de Máquina (LLMs) no processamento de grandes quantidades de dados. Liang, de 40 anos, também é o fundador da High-Flyer Quant, empresa controladora da DeepSeek, o fundo de hedge que forneceu o poderio financeiro para financiar os avanços técnicos da startup de IA. No final de fevereiro, o empreendedor participou de um simpósio que reuniu empreendedores de tecnologia, com a presença do presidente chinêsdent Jinping. O presidentedent a startup como um sinal da resiliência do país diante das medidas dos Estados Unidos para conter o progresso da IA na China.
Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.
Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.
Owotunse Adebayo
Adebayo é um escritor com quatro anos de experiência no universo das criptomoedas. Ele se formou na Universidade de Lagos, onde estudou Planejamento Urbano e Regional. Adebayo trabalhou na Tokenhell e na CryptoTicker, escrevendo notícias sobre criptomoedas e fintechs. Atualmente, ele é colaborador do Cryptopolitan.
CURSO
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)














