ÚLTIMAS NOTÍCIAS
SELECIONADO PARA VOCÊ
SEMANALMENTE
MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

A OpenAI lança o GPT-OSS, seu primeiro modelo de IA de código aberto

PorJai HamidJai Hamid
Tempo de leitura: 3 minutos
A OpenAI lança o GPT-OSS, seu primeiro modelo de IA de código aberto
  • A OpenAI disponibilizou dois modelos de peso aberto, gpt-oss-120b e gpt-oss-20b, para uso público.
  • Os modelos podem ser baixados sob a licença Apache 2.0 e executados em plataformas como GitHub, Hugging Face e LM Studio.
  • A OpenAI filtrou dados sensíveis e realizou testes para detectar ajustes maliciosos antes do lançamento.

A OpenAI lançou seus primeiros modelos de IA de código aberto desde 2019, pondo fim a anos de atrasos e especulações. A empresa lançou na terça-feira o gpt-oss-120b e o gpt-oss-20b, oferecendo dois modelos de linguagem de grande porte totalmente personalizáveis ​​e disponíveis para download, que não exigem pagamento de licença nem acesso à API.

Ambos os modelos são exclusivamente em texto e estão sendo compartilhados sob uma licença Apache 2.0, o que significa que qualquer pessoa pode baixar os pesos dos modelos de plataformas como GitHub e Hugging Face.

Eles também funcionam no LM Studio e no Ollama, e podem ser executados em tudo, desde laptops até servidores em nuvem. A OpenAI afirmou que os modelos são otimizados para funcionar em uma variedade de hardwares, incluindo dispositivos de consumo e chips da Nvidia, AMD, Cerebras e Groq.

A OpenAI treinou modelos para bloquear ajustes finos maliciosos

A OpenAI afirmou que adiou o lançamento dos modelos para concluir as avaliações de segurança. Durante o pré-treinamento, a empresa filtrou material sensível, especificamente dados químicos, biológicos, radiológicos e nucleares. Também testou cenários em que agentes mal-intencionados poderiam tentar ajustar os modelos para tarefas maliciosas.

A empresa informou que nenhum desses experimentos resultou em modelos que atingissem seu limite interno de "alta capacidade", uma classificação descrita em sua Estrutura de Preparação, que ela utiliza para avaliar o potencial de danos.

Greg Brockman,dentda OpenAI, disse aos repórteres: "Tem sido empolgante ver um ecossistema se desenvolver, e estamos animados para contribuir com isso, realmente expandir as fronteiras e ver o que acontece a partir daí."

Ele acrescentou que a empresa também incluiu três grupos de especialistas externos para auditar e comentar o aprimoramento dos testes de segurança. Esses modelos não são de código aberto no sentido tradicional.

A OpenAI está fornecendo apenas os pesos do modelo, não o código de treinamento completo ou os conjuntos de dados. Mas eles ainda são suficientemente abertos para permitir que os usuários testem, ajustem e implementem os modelos da maneira que acharem melhor. A empresa apresentou isso como um meio-termo entre total transparência e a manutenção de certo controle.

Amazon, Microsoft e Anthropic expandem o mercado de IA

Os modelos também estarão disponíveis por meio de plataformas em nuvem. Amazon, Microsofte Baseten estão oferecendo gpt-oss-120b e gpt-oss-20b diretamente aos clientes.

Esta é a primeira vez que a Amazon Web Services (AWS) hospedará modelos da OpenAI, e eles estarão acessíveis tanto pelo Bedrock quanto pelo SageMaker. A Amazon afirmou que esses modelos ajudarão os clientes a criar agentes de IA capazes de raciocínio avançado e pensamento passo a passo.

Andy Jassy, ​​CEO da Amazon, posicionou a AWS como um mercado onde as empresas podem escolher entre diversos fornecedores de IA, e não apenas as ferramentas internas da Amazon. Além da OpenAI, a Amazon também firmou parceria com a Anthropic, investindo US$ 8 bilhões na startup de IA.

Esse acordo permite que os clientes da AWS acessem os modelos Claude da Anthropic. Na terça-feira, a Anthropic anunciou o lançamento de um novo modelo Claude, que, segundo a empresa, é melhor em codificação, pesquisa e análise de dados do que as versões anteriores.

Com esse lançamento, a OpenAI se posiciona no mesmo patamar de outras empresas que oferecem modelos de código aberto, como a Meta, a Mistral AI (apoiada pela Microsoft) e a DeepSeek, uma startup chinesa que já havia chamado a atenção por desenvolver um modelo de IA com raciocínio semelhante ao humano.

Jensen Huang, CEO da Nvidia, afirmou: "A OpenAI mostrou ao mundo o que poderia ser construído com a IA da Nvidia — e agora eles estão impulsionando a inovação em software de código aberto." A Nvidia fez uma parceria com a OpenAI para garantir que os modelos tivessem um bom desempenho em todo o seu hardware. O mesmo fizeram a AMD, a Cerebras e a Groq, oferecendo aos usuários mais flexibilidade na escolha de onde executar os modelos.

Tanto o gpt-oss-120b quanto o gpt-oss-20b suportam processamento de cadeia de pensamento, uso de ferramentas e tarefas que exigem raciocínio em várias etapas. Os usuários podem executá-los localmente ou na nuvem sem precisar chamar uma API ou depender de um plano pago.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Compartilhe este artigo
Jai Hamid

Jai Hamid

Jai Hamid é uma escritora de finanças com seis anos de experiência cobrindo criptomoedas, mercados de ações, tecnologia, economia global e eventos geopolíticos que afetam os mercados. Ela trabalhou com publicações focadas em blockchain, incluindo AMB Crypto, Coin Edition e CryptoTale, cobrindo análises de mercado, grandes empresas, regulamentação e tendências macroeconômicas. Ela estudou na London School of Journalism e já participou três vezes de programas em uma das principais redes de TV da África para compartilhar insights sobre o mercado de criptomoedas.

MAIS… NOTÍCIAS
INTENSIVO AVANÇADAS
CURSO