O agente Operator da OpenAI recebe um impulso com um novo modelo de IA

- A OpenAI atualizou o Operator, seu agente de IA que usa a web para realizar tarefas, para um modelo baseado no o3, após anteriormente usar uma versão personalizada do GPT-4o.
- O operador o3 foi ajustado com dados de segurança adicionais para uso em computador, incluindo conjuntos de dados de segurança projetados para ensinar os limites de decisão do modelo.
- Mike Knoop, um dos fundadores da Arc Prize Foundation, acredita que executar o modelo o3 pode ser mais caro do que o esperado.
A OpenAI atualizou o modelo de IA que alimenta o Operator, substituindo a versão personalizada anterior do GPT-4o por um modelo baseado no o3, um dos mais recentes da série o de modelos de "raciocínio" da OpenAI. O Operator o3 foi ajustado com dados de segurança adicionais para uso computacional e incluiu conjuntos de dados de segurança projetados para ensinar ao modelo os limites de decisão.
A OpenAI atualizou o Operador no ChatGPT com um novo modelo de Agente de Uso de Computador (CUA) baseado em uma versão do OpenAI o3. Com o novo modelo, o Operador tornou-se mais persistente e preciso ao interagir com o navegador, melhorando a taxa geral de sucesso das tarefas. Ele também fornece respostas mais bem estruturadas, claras e completas.
Segundo a OpenAI, o novo modelo CUA apresentoutronem relação ao setor, alcançando o estado da arte (SOTA) no OSWorld e no WebArena. Também demonstroutronà versão anterior, tanto em benchmarks estabelecidos quanto em avaliações de preferência humana.
A OpenAI substitui o modelo baseado em GPT-4o por uma versão baseada em o3
OpenAI indica uma grande atualização para o agente operador do ChatGPT. pic.twitter.com/iGPQp9butD
– SabatAge (@sabatage) 22 de maio de 2025
A OpenAI substituiu o modelo existente do Operator baseado em GPT-4o por uma versão baseada no OpenAI o3, embora a versão da API continue sendo baseada no 4o. A empresa de IA também afirmou que o Operator o3 utiliza a mesma abordagem de segurança multicamadas usada na versão 4o.
No entanto, em comparação com outros modelos da família o3, o o3 Operator foi ajustado com dados de segurança adicionais para uso computacional, incluindo conjuntos de dados de segurança projetados para ensinar ao modelo os limites de decisão sobre confirmações e recusas.
A OpenAI divulgou um relatório técnico demonstrando o desempenho do o3 Operator em avaliações de segurança específicas. Comparado ao modelo GPT-4o Operator, o o3 Operator apresentou menor probabilidade de se recusar a realizar atividades "ilícitas" e a buscar dados pessoais sensíveis, além de ser menos suscetível a um tipo de ataque de IA conhecido como "injeção de prompt".
“O o3 Operator utiliza a mesma abordagem de segurança em múltiplas camadas que usamos na versão 4o do Operator… Embora o o3 Operator herde as capacidades de codificação do o3, ele não tem acesso nativo a um ambiente de codificação ou Terminal.”
A empresa de IA também revelou que o novo modelo baseado em o3 passou por avaliações de segurança padrão e que o Operator continuou disponível como uma prévia para usuários do ChatGPT Pro em todo o mundo. No entanto, esse modelo atualizado estava disponível apenas no Operator dentro do ChatGPT.
Knoop suspeita que executar o modelo o3 da OpenAI possa ser mais caro do que o esperado
Na semana passada, a Arc Prize Foundation, responsável pela manutenção e administração do ARC-AGI, atualizou suas estimativas de custos computacionais para o o3. Inicialmente, a organização estimou que a configuração de melhor desempenho do o3 testada, o o3 high, custaria cerca de US$ 3 mil para resolver um único problema do ARC-AGI. No entanto, a Fundação agora acredita que o custo pode ser 10 vezes maior do que o estimado anteriormente, possivelmente em torno de US$ 30 mil por tarefa.
Além disso, embora a OpenAI ainda não tenha definido o preço do o3 nem o lançado completamente, um dos cofundadores da Arc Prize Foundation, Mike Knoop, acredita que o preço do modelo o1-pro seja uma aproximação razoável e uma comparação mais precisa do custo real do o3. Ele acrescentou, no entanto, que o o3 continuará sendo classificado como uma prévia no ranking para refletir a incerteza até que o preço oficial seja anunciado.
Segundo a Arc Prize Foundation, um preço elevado para o modelo o3 high não seria algo fora de questão, dada a quantidade de recursos computacionais que ele supostamente utiliza. O modelo o3 high usou 172 vezes mais poder computacional do que o modelo o3 low, a configuração com menor capacidade computacional do o3, para lidar com o ARC-AGI.
rumores circulam sobre os planos caros que a OpenAI estaria considerando lançar para clientes corporativos. As informações indicam que a empresa poderia cobrar até US$ 20 mil por mês por "agentes" de IA especializados, como agentes para desenvolvedores de software.
No entanto, embora alguns argumentassem que mesmo os modelos mais caros da OpenAI custariam bem menos do que umtracou funcionário humano típico cobraria, o pesquisador de IA Toby Ord apontou que os modelos podem não ser tão eficientes. Por exemplo, o modelo o3 high precisou de 1.024 tentativas em cada tarefa do ARC-AGI para atingir sua melhor pontuação.
Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Collins J. Okoth
Collins Okoth é jornalista e analista de mercado com 8 anos de experiência na cobertura de criptomoedas e tecnologia. Ele é Analista Financeiro Certificado (CFA) e possui formação emmaticAtuarial. Collins já trabalhou como redator e editor na Geek Computer e na CoinRabbit.
CURSO
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)














