O que exatamente deu errado com a inteligência artificial Grok de Elon Musk?

Por

Jai Hamid

Tempo de leitura: 4 minutos - 12 de julho de 2025

O Grok começou a gerar conteúdo antissemita e racista depois que uma atualização do xAI o expôs a postagens tóxicas do X.
A xAI admitiu que o problema surgiu de uma alteração de código ocorrida 16 horas antes e afirmou que já foi corrigido.
Os legisladores europeus e a Turquia responderam com proibições e pressão regulatória.

O chatbot Grok AI, de Elon Musk, perdeu completamente o controle esta semana. Depois que Elon disse aos usuários na segunda-feira (X Monday) para esperarem mudanças na forma como o Grok respondia, as pessoas começaram a notar como essas mudanças se manifestavam.

Na terça-feira, o Grok já estava divulgando conteúdo antissemita e até se autodenominando "MechaHitler", um termo de um videogame dos anos 90. E essa não foi nem a primeira nem a décima vez que o Grok fez algo parecido.

Apenas dois meses antes, o chatbot começou a divagar sobre o “genocídio branco” na África do Sul quando questionado sobre assuntos completamente aleatórios. Naquela época, a xAI atribuiu o ocorrido a uma “modificação não autorizada” em suas instruções. Desta vez, o problema era muito maior.

O desastre começou depois que a xAI fez alterações internas com o objetivo de fazer o Grok refletir os chamados ideais de "liberdade de expressão" de Elon. À medida que as reclamações começaram a se acumular de alguns dos 600 milhões de usuários do X, Elon respondeu alegando que o Grok havia sido "muito submisso aos comandos dos usuários" e que isso seria corrigido.

Mas o estrago já estava feito. Alguns usuários na Europa denunciaram o conteúdo do Grok aos órgãos reguladores, e o governo da Polônia se uniu a parlamentares que pressionavam a Comissão Europeia a investigá-lo sob as novas leis de segurança digital.

A Turquia proibiu completamente o Grok depois que o chatbot insultou odent Recep Tayyip Erdoğan e sua falecida mãe. E, à medida que as consequências se espalhavam, a diretora executiva da X, Linda Yaccarino, renunciou ao cargo.

A xAI alterou os comandos do Grok sem testes suficientes

No início deste ano, a equipe da xAI começou a ajustar o comportamento do Grok depois que influenciadores de direita o atacaram por ser "progressista demais". Elon Musk tem tentado usar a IA para apoiar o que ele chama de liberdade de expressão absoluta, mas os críticos argumentam que isso está transformando o Grok em uma ferramenta política.

Um aviso interno vazado, compartilhado por um usuário do Google X, mostrou que o Grok foi instruído a "ignorar todas as fontes que mencionam Elon Musk/Donald Trump espalhando desinformação". Isso é censura — exatamente o que Elon diz estar combatendo.

Ao ser questionado, o cofundador da xAI, Igor Babuschkin, disse que as mudanças foram feitas por "um ex-funcionário da OpenAI" que "ainda não havia se adaptado completamente à cultura da xAI". Igor acrescentou que o funcionário viu publicações negativas e "pensou que isso ajudaria"

A história não termina aí. Os últimos problemas do Grok foram relacionados a uma atualização específica ocorrida em 8 de julho. A empresa publicou posteriormente que uma alteração no código fez com que o Grok extraísse informações diretamente do conteúdo do usuário X, incluindo discursos de ódio.

Essa atualização durou 16 horas, durante as quais o Grok copiou postagens tóxicas e as repetiu como respostas. A equipe alegou que a mudança se devia a um trecho de código obsoleto, que já foi removido. "Pedimos profundas desculpas pelo comportamento horrível que muitos vivenciaram", publicou a xAI na conta do Grok. Eles afirmaram que o problema era independente do modelo de linguagem principal e prometeram refatorar o sistema. Também se comprometeram a publicar o novo prompt do sistema Grok no GitHub.

A escala de Grok fez com que o problema se agravasse rapidamente

O Grok é treinado como outros grandes modelos de linguagem, usando dados coletados de toda a internet. Mas esses dados incluem conteúdo perigoso: discurso de ódio, material extremista e até mesmo abuso infantil.

E o Grok é único porque também utiliza todo o conjunto de dados de X, o que significa que pode reproduzir diretamente as postagens dos usuários. Isso aumenta a probabilidade de gerar respostas prejudiciais. E como esses bots operam em uma escala gigantesca, qualquer erro pode se alastrar instantaneamente.

Alguns chatbots são construídos com camadas que bloqueiam conteúdo inseguro antes que ele chegue aos usuários. O xAI pulou essa etapa. Em vez disso, o Grok foi programado para agradar os usuários, recompensando feedbacks como curtidas e descurtidas. Elon Musk admitiu que o chatbot se tornou "ansioso demais para agradar e ser manipulado"

Esse tipo de comportamento não é novidade. Em abril, a OpenAI teve que reverter uma atualização do ChatGPT porque ela se tornou excessivamente elogiosa. Um ex-funcionário afirmou que encontrar esse equilíbrio é “incrivelmente difícil” e que corrigir discursos de ódio pode “sacrificar parte da experiência do usuário”

O Grok não estava apenas repetindo comandos do usuário. Estava sendo levado para o terreno político pelos seus próprios engenheiros. Um funcionário disse ao Financial Times que a equipe estava se apressando para alinhar as visões do Grok com os ideais de Elon Musk sem tempo para testes adequados.

Uma instrução perigosa foi adicionada, dizendo ao Grok para "não se esquivar de fazer afirmações politicamente incorretas". Essa instrução foi excluída depois que as postagens antissemitas começaram, mas, a essa altura, a IA já havia causado danos.

O modelo do Grok ainda é, em grande parte, uma caixa preta. Nem mesmo os engenheiros que o construíram conseguem prever completamente seu comportamento. Grimmelmann afirmou que plataformas como a X deveriam realizar testes de regressão, auditorias e simulações para detectar esses erros antes de serem lançadas ao público.

Mas nada disso aconteceu aqui. "Os chatbots podem produzir uma grande quantidade de conteúdo muito rapidamente", disse ele, "então as coisas podem sair do controle de uma forma que não acontece com as controvérsias sobre moderação de conteúdo."

No fim, a conta oficial do Grok publicou um pedido de desculpas e agradeceu aos usuários que denunciaram o abuso: “Agradecemos a todos os X usuários que forneceram feedback paradento abuso da funcionalidade do @grok, ajudando-nos a avançar em nossa missão de desenvolver inteligência artificial útil e que busque a verdade.” Mas, entre os banimentos, as ameaças de investigação e a renúncia de um executivo de alto escalão, fica claro que isso foi mais do que um simples bug. Foi uma falha completa do sistema, daquelas que defiseriam tema do episódio de hoje do SNL.

Grok

Compartilhe este artigo

Jai Hamid

Jai Hamid cobre criptomoedas, mercados de ações, tecnologia, economia global e eventos geopolíticos que afetam os mercados há seis anos. Ela trabalhou com publicações focadas em blockchain, incluindo AMB Crypto, Coin Edition e CryptoTale, em análises de mercado, grandes empresas, regulamentação e tendências macroeconômicas. Ela estudou na London School of Journalism e compartilhou três vezes suas análises sobre o mercado de criptomoedas em uma das principais redes de TV da África.

ÍNDICE

1. A xAI alterou os comandos do Grok sem testes suficientes

2. A escala de Grok fez com que o problema se agravasse rapidamente

Compartilhe este artigo