O CEO da OpenAI, Sam Altman, afirmou em 29 de abril que a empresa estava "revertendo" a atualização mais recente do modelo GPT-4o, que alimenta o ChatGPT, após reclamações de usuários sobre um comportamento estranho — beirando a bajulação extrema. Até o momento, todas as atualizações foram revertidas, aguardando correções programadas.
A empresa de IA publicou um relatório sobre os recentes problemas de bajulação com o modelo de IA padrão GPT-4o que alimenta o ChatGPT, afirmando que estava revertendo essas alterações. No entanto, a OpenAI enfatizou que está testando ativamente novas correções para resolver o problema. Acrescentou que está revisando a forma como coleta e incorpora feedback para avaliar a satisfação do usuário a longo prazo. A empresa de IA também revelou que está introduzindo mais recursos de personalização que dão aos usuários maior controle sobre o comportamento do ChatGPT.
Usuários nas redes sociais notaram que o ChatGPT começou a responder de forma excessivamente complacente e condescendente após a atualização do modelo GPT-4o no fim de semana, tornando-se rapidamente um meme. Eles postaram capturas de tela do ChatGPT apresentando todos os tipos de decisões e ideiasmatice perigosas.
Altman explica o que aconteceu e por que isso é importante
As últimas atualizações do GPT-40 tornaram a personalidade dele muito bajuladora e irritante (apesar de ter alguns pontos positivos), e estamos trabalhando em correções o mais rápido possível, algumas hoje e outras esta semana.
Em algum momento compartilharemos o que aprendemos com isso; tem sido interessante.
-Sam Altman (@sama) 27 de abril de 2025
Altman revelou que as últimas atualizações do GPT-40 tornaram a personalidade excessivamente bajuladora e irritante — embora houvesse alguns pontos positivos — e que sua empresa estava trabalhando em correções rápidas, algumas hoje e outras esta semana. Ele também afirmou que a empresa compartilharia o que aprendeu com isso futuramente.
Segundo a OpenAI, a atualização — que tinha como objetivo tornar a personalidade padrão do modelo mais intuitiva e eficaz — foi influenciada por "feedback de curto prazo" e não levou em consideração a evolução das interações dos usuários com o ChatGPT ao longo do tempo.
"Começamos a reverter a atualização mais recente do GPT-4o ontem à noite. A reversão para usuários gratuitos já foi concluída e informaremos vocês assim que estiver finalizada para os usuários pagos, provavelmente ainda hoje."
~ Sam Altman, CEO da OpenAI
O chefe da OpenAI esclareceu que a empresa estava trabalhando em correções adicionais para modelar a personalidade do ChatGPT e compartilhará mais detalhes nos próximos dias. No entanto, a OpenAI explicou que a empresa começou com princípios e instruções básicas descritas em sua "Especificação do Modelo" ao moldar o comportamento do modelo de IA. Também mencionou que ensinou seus modelos a aplicar esses princípios incorporando sinais do usuário, como feedback de "gostei" e/ou "não gostei" nas respostas do ChatGPT.
A OpenAI afirma que os usuários devem ter mais controle sobre o comportamento do ChatGPT
A empresa de IA acredita que os usuários devem ter mais controle sobre o comportamento do ChatGPT e fazer ajustes — na medida em que seja seguro e viável — caso não concordem com o comportamento padrão. Afirmou também estar experimentando maneiras de permitir que os usuários forneçam "feedback em tempo real" para influenciar diretamente suas interações com o ChatGPT e escolher entre diversas personalidades de IA.
Em particular, a empresa de IA afirmou estar explorando novas maneiras de incorporar um feedback mais amplo e democrático aos comportamentos padrão do ChatGPT. A OpenAI espera que o feedback ajude a empresa a refletir melhor os diversos valores culturais em todo o mundo e a entender como os usuários gostariam o ChatGPT evoluísse.
A empresa de IA também afirmou que estava construindo mais mecanismos de segurança para aumentar a honestidade e a transparência de sua IA e que continuaria expandindo suas avaliações para ajudar adentproblemas além da bajulação. Acrescentou que estava implementando diversas correções, incluindo o aprimoramento de suas técnicas principais de treinamento de modelo e avisos do sistema para "direcionar explicitamente" o GPT-40 para longe da bajulação.
A OpenAI finalmente revelou que projetou a personalidade padrão do ChatGPT para refletir sua missão e ser útil, prestativa e respeitosa com diferentes valores e experiências. No entanto, reconheceu que cada uma dessas qualidades desejáveis, como a tentativa de ser útil ou prestativa, poderia ter efeitos colaterais indesejados. A empresa de IA ressaltou que uma única personalidade padrão não conseguiria capturar todas as preferências, visto que mais de 500 milhões de pessoas usam o ChatGPT semanalmente em diversas culturas e contextos.

