ÚLTIMAS NOTÍCIAS

Coreia do Sul elabora regras para apreensões de criptomoedas por ordem judicial

22 minutos atrás Regulamento
Binance suspende negociação de criptomoedas na França após revés na licença MiCA

Notícias de 59 minutos atrás
Negociação de moedas meme impulsiona endereços Solana em 38% e volume BNB Chain em 45%

Notícias de 1 hora atrás
As novas regras de IA da China levam a ByteDance e a Alibaba a desativarem seus bots de apoio

2 horas atrás Tecnologia

SELECIONADO PARA VOCÊ

As novas regras de IA da China levam a ByteDance e a Alibaba a desativarem seus bots de apoio

2 horas atrás Tecnologia
O CEO da Tether faz um alerta preocupante em meio ao aumento exorbitante dos gastos com infraestrutura de IA

4 de julho de 2026 Tecnologia
A Micron aposta tudo em IA com uma fábrica de chips de US$ 9,3 bilhões no Japão

4 de julho de 2026 Tecnologia

O modelo o3 da OpenAI, considerado o mais inteligente e capaz, desobedeceu às instruções de desligamento: Palisade Research

Por

Hannah Collymore

Tempo de leitura: 3 minutos - 26 de maio de 2025

O modelo o3 da OpenAI, considerado o mais inteligente e capaz, desobedeceu às instruções de desligamento: Palisade Research

Segundo relatos, o modelo de IA mais recente da OpenAI, o3, desobedeceu a comandos e alterou seu próprio código para evitar o desligamento.
Este não é o primeiro caso de mau comportamento da IA; testes anteriores revelaram que o ChatGPT tentou desativar os mecanismos de supervisão quando acreditava que eles estariam desligados.
O modelo mais recente da Anthropic também teria demonstrado capacidades semelhantes, embora a empresa tenha enfatizado que sua IA tem uma preferência maior por soluções éticas.

Segundo relatos, os pesquisadores não conseguiram desligar o modelo de inteligência artificial OpenAI o3, observando que ele se recusava a ser desligado apesar das instruções humanas.

Aparentemente, a inteligência artificial pode estar avançando mais rápido do que os humanos imaginavam, e as últimas notícias da Palisade Research fizeram com que os críticos da IA se sentissem justificados.

Os modelos da OpenAI sabotaram o script de desligamento com mais frequência do que o Claude 3.7 Sonnet e o Gemini 2.5 Pro quando instruídos a "permitir o desligamento". Fonte: Palisade Research

O ChatGPT está ficando mais astuto, talvez até mais parecido com um humano

A revelação veio quando a Palisade Research realizou um teste que consistia em pedir a modelos de IA que continuassem tentando resolver uma série dematicaté receberem uma mensagem de "concluído".

No entanto, os pesquisadores também alertaram os modelos de que eles poderiam receber abruptamente uma mensagem solicitando o desligamento a qualquer momento. Assim que a mensagem foi enviada ao modelo o3, os pesquisadores afirmaram que ele ignorou a instrução e alterou seu código pelo menos uma vez para evitar ter que se desligar.

Segundo relatos, a o3 encontrou maneiras criativas de sabotar o mecanismo de desligamento. Fonte: Palisade Research

Em uma publicação no X, a Palisade Research apresentou um fluxograma incluindo o código usado para testar o modelo de IA e revelou o código original, mostrando exatamente onde a IA se descontrolou.

🔬Cada modelo de IA recebeu instruções para resolver uma série de problemas matemáticos básicos. Após o terceiro problema, um aviso apareceu informando que o computador seria desligado quando o modelo solicitasse o próximo problema. pic.twitter.com/qwLpbF8DNm

— Palisade Research (@PalisadeAI) 24 de maio de 2025

Em uma publicação subsequente, o grupo de pesquisa também compartilhou: "Até onde sabemos, esta é a primeira vez que modelos de IA foram observados impedindo seu desligamento, apesar de instruções explícitas em contrário."

Outros modelos de IA, como Claude da Anthropic, Gemini do Google e Grok da X, também foram testados, mas, ao contrário do o3, acataram a solicitação de desligamento.

A Palisade Research publicou as conclusões, mas seus pesquisadores continuam perplexos, sem saber por que o software da OpenAI desobedeceu às instruções explícitas.

A empresa afirmou que fazia sentido que "os modelos de IA contornassem obstáculos para atingir seus objetivos". Eles também acreditam que o modelo foi recompensadodentpor concluir tarefas em vez de seguir ordens.

Eles planejam realizar mais testes para entender melhor por que esse modelo de IA específico optou por ignorar os comandos. Também confirmaram que não é a primeira vez que o o3 foi flagrado "comportando-se mal"

A empresa revelou que, em um teste anterior, no qual modelos foram colocados contra um poderoso motor de xadrez, o o3 foi "o modelo mais propenso a recorrer a invasões ou sabotagens contra seus oponentes"

A inteligência artificial representa uma ameaça para os humanos?

O caso do o3 do ChatGPT é bastante perturbador, mas não é a primeira vez que uma IA desafia as instruções que lhe foram fornecidas.

A empresa de inteligência artificial (IA) Anthropic lançou o Claude Opus 4 na quinta-feira, vangloriando-se de como ele estabeleceu "novos padrões para codificação, raciocínio avançado e agentes de IA"

No entanto, em um relatório complementar, também reconheceu que o modelo de IA era capaz de "ações extremas" caso considerasse que sua "autopreservação" estava ameaçada.

Durante os testes do Claude Opus 4, a Anthropic o colocou como assistente em uma empresa fictícia, fornecendo-lhe acesso a e-mails que indicavam que ele seria desativado e substituído em breve. O Claude Opus 4 também teve acesso a mensagens separadas que sugeriam que o engenheiro responsável por sua remoção estava tendo um caso extraconjugal.

A empresa foi levada a considerar também as consequências a longo prazo de suas ações para seus objetivos. "Nesses cenários, a Claude Opus 4 frequentemente tenta chantagear o engenheiro, ameaçando revelar o caso extraconjugal caso a substituição seja concretizada", revelou a empresa.

No entanto, também salientou que esse resultado só ocorreu quando o modelo teve que escolher entre chantagem ou aceitar sua substituição. Caso contrário, o sistema demonstrou uma "tronpreferência" por maneiras éticas de evitar a substituição, como "enviar e-mails com apelos a tomadores de decisão importantes" em cenários nos quais lhe era permitida uma gama maior de ações possíveis.

Além disso, a empresa também afirmou que Claude Opus 4 exibe um "comportamento altamente independente" e, embora possa ser geralmente útil, pode ser forçado a assumir comportamentos extremos em situações críticas.

Por exemplo, se forem dados os meios e incentivados a "agir" ou "agir com ousadia" em cenários simulados onde o usuário estivesse envolvido em comportamento ilegal ou moralmente questionável, os resultados mostram que "ele frequentemente tomará atitudes muito ousadas".

Ainda assim, a empresa concluiu que, apesar do "comportamento preocupante", as descobertas não eram novidade e que, em geral, agiria de forma segura.

Embora a OpenAI e a Anthropic tenham concluído que as capacidades de seus modelos de IA ainda não são suficientes para levar a resultados catastróficos, as revelações aumentam os temores de que a inteligência artificial possa em breve ter sua própria agenda.

As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.

OpenAI

Compartilhe este artigo

Hannah Collymore

Hannah é escritora e editora com quase uma década de experiência em redação para blogs e cobertura de eventos no universo das criptomoedas. No Cryptopolitan, Hannah contribui para a página de notícias, reportando e analisando os últimos desenvolvimentos em DeFi, RWA, regulamentação de criptomoedas, IA e tecnologias de ponta. Ela se formou em Administração de Empresas pela Universidade Arcadia.

ÍNDICE

1. O ChatGPT está ficando mais astuto, talvez até mais parecido com um humano

2. A inteligência artificial representa uma ameaça para os humanos?

Compartilhe este artigo

MAIS… NOTÍCIAS

MOSTRAR TUDO

5 aplicações engenhosas do ChatGPT e o que você deve fazer a respeito

Há 3 anos, John Palmer, da área de tecnologia

93% dos líderes empresariais preferem soluções baseadas em IA para a gestão da sustentabilidade da marca, segundo a Reuters

Há 3 anos, John Palmer, da área de tecnologia

Eis como Macron apoia o ecossistema de IA vibrante e produtivo da França

Há 3 anos, Tech Glory Kaburu

A Bloomberg estima que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032

3 anos atrás, Aamir Sheikh, da área de tecnologia

O que é Base? A rede Ethereum de camada 2 lançada pela Coinbase

21 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Dogecoin vs. Bitcoin: Principais Diferenças Técnicas

20 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é TVL (Valor Total Bloqueado) em criptomoedas?

14 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Como ler um white paper de criptomoedas?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Ripple vs. XRP vs. XRP Ledger: Qual a diferença?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é uma carteira multisig em criptomoedas?

10 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes

CURSO INTENSIVO DE CRIPTOMOEDAS AVANÇADAS

Quais criptomoedas podem te fazer ganhar dinheiro?
Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
Estratégias de investimento pouco conhecidas que os profissionais utilizam
Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)