A fabricante de chatgpt, Openai, anunciou na quarta-feira o lançamento de dois modelos de IA de raciocínio conhecidos como O3 e O4-Mini, que devem pausar e trabalhar com perguntas antes que possam responder.
Isso ocorre apenas uma semana depois que a startup da IA anunciou que estava removendo seu modelo de idioma GPT-4 do ChatGPT em 30 de abril, substituindo-o por um modelo por desempenho superior, enquanto outros modelos menores estavam no pipeline e prontos para serem lançados para o mercado.
OpenAI descreve o O3 como seu modelo de raciocínio mais avançado de todos os tempos
A startup de IA chama seu O3 como o modelo de raciocínio mais avançado da empresa, ao superar outros modelos anteriores em testes que medem as capacidades de matemática, raciocínio, codificação, ciência e entendimento visual.
"O3 e O4 Mini são super bons em codificação, por isso estamos lançando um novo produto, Codex CLI, para facilitar o uso", anunciou o CEO do OpenAI, Sam Altman, em uma postagem na plataforma X.
"Este é um agente de codificação que é executado no seu computador. Ele é totalmente de código aberto e hoje disponível, esperamos que ele melhore rapidamente".
Altmann.
Quanto ao O4-mini, ele oferece o que a empresa diz ser uma troca competitiva entre preço, velocidade e desempenho. De acordo com o TechCrunch, esses são fatores que os desenvolvedores costumam considerar ao escolher um modelo de IA para alimentar seus aplicativos.
Comentando seus modelos, o OpenAI sustenta que a O3 atinge o desempenho de ponta no SWE-banche Verificado (sem andaimes personalizados), que é um teste que mede as habilidades de codificação, com o modelo com 69,1%.
Segundo a empresa, o O4-mini também alcança o mesmo desempenho em 68,1%. O próximo melhor modelo da startup, O3-Mini, obteve 49,3% no teste, enquanto o claude de 3,7 sonetos da Anthropic obteve 62,3%.
De acordo com o TechCrunch , o modelo O3 quase não foi lançado no ChatGPT, pois Altman sinalizou em fevereiro que a empresa queria canalizar mais recursos para a tecnologia sofisticada da O3.
No entanto, a pressão competitiva aparentemente levou a OpenAI para eventualmente reverter o curso.
O3 e O4-Mini são super bons em codificação, por isso estamos lançando um novo produto, Codex CLI, para facilitar o uso.
Este é um agente de codificação que é executado no seu computador. É totalmente de código aberto e está disponível hoje; we expect it to rapidly improve.
- Sam Altman (@sama) 16 de abril de 2025
Openai quer ficar à frente dos concorrentes como o Google
Os novos modelos chegam em um momento em que o OpenAI está se esforçando para ficar à frente da competição, particularmente o Google, Meta, Antrópico, Xai e Chinês Deepseek.
O Openai foi o primeiro a lançar um modelo de raciocínio de IA O1. No entanto, os concorrentes conseguiram seguir rapidamente com versões próprias que correspondem ou excedem o desempenho da programação do OpenAI. Isso também ocorre quando os modelos de raciocínio começaram a dominar o campo, pois os laboratórios de IA desejam obter mais desempenho de seus sistemas.
Comparado com outros modelos de raciocínio lançados antes, os modelos O3 e O4-Mini têm a capacidade de gerar respostas usando ferramentas no ChatGPT, por exemplo, navegação na Web, execução de código Python, processamento de imagens e geração de imagens.
Comentando o anúncio, os entusiastas da IA descreveram o desenvolvimento como "super" e uma grande jogada como "codificação local é o futuro".
"Esta é a maior mudança no chatgpt desde os plugins. Mas mais suave. Tudo funciona fora da caixa, e os modelos escolhem como resolver um problema. É um passo bastante em direção à IA que realmente ajuda, não apenas bate -papos".
Azhar Ahmed.
Segundo a empresa, os assinantes do OpenAI's Pro, mais, e os planos da equipe podem acessar os novos modelos, juntamente com uma variante do O4-mini conhecido como "O4-Mini-High". Isso leva mais tempo gerando respostas para melhorar a confiabilidade.
O Openai diz que os novos modelos são seus primeiros modelos que podem "pensar com imagens". Isso significa que os usuários podem fazer upload de fotos para chatgpt e os modelos analisarão as imagens durante sua fase "cadeia de pensamento" antes de responder. Com essa nova habilidade, os modelos compreendem imagens embaçadas e de baixa qualidade e podem executar tarefas como zoom ou girar imagens como eles argumentarem.
Recursos externos de processamento de imagens, os dois modelos podem executar e executar o código Python diretamente no navegador de um usuário através do recurso de tela do ChatGPT e pesquisar na Web quando perguntado sobre os eventos atuais.
Academia Cryptopolitan: Quer aumentar seu dinheiro em 2025? Aprenda a fazê -lo com DeFi em nossa próxima webclass. Salve seu lugar