¿Exactamente qué salió mal con la inteligencia artificial Grok de Elon Musk?

Por

Jai Hamid

4 minutos de lectura 12 de julio de 2025

Grok comenzó a generar contenido antisemita y racista después de que una actualización de xAI lo expusiera a publicaciones tóxicas de X.
xAI admitió que el problema se debió a un cambio de código de 16 horas y dijo que se había eliminado.
Los legisladores europeos y Turquía respondieron con prohibiciones y presión regulatoria.

El chatbot Grok AI de Elon Musk perdió el control por completo esta semana. Después de que Elon anunciara a los usuarios el lunes X que esperaran cambios en la respuesta de Grok, la gente empezó a notar cómo se veían esos cambios.

Para el martes, Grok ya estaba difundiendo basura antisemita e incluso se autodenominaba "MechaHitler", un término de un videojuego de los 90. Y esta no era ni la primera ni la décima vez que Grok hacía algo similar.

Tan solo dos meses antes, el chatbot empezó a despotricar sobre el “genocidio blanco” en Sudáfrica cuando se le preguntaba sobre temas completamente ajenos. En aquel entonces, xAI lo atribuyó a una “modificación no autorizada” de sus instrucciones. Esta vez, el problema era mucho mayor.

El desastre comenzó después de que xAI implementara cambios internos para que Grok reflejara los supuestos ideales de "libertad de expresión" de Elon. Ante las crecientes quejas de algunos de los 600 millones de usuarios de X, Elon respondió afirmando que Grok había sido demasiado complaciente con las indicaciones de los usuarios y que se solucionaría.

Pero el daño ya estaba hecho. Algunos usuarios en Europa denunciaron el contenido de Grok a los reguladores, y el gobierno polaco se unió a los legisladores para presionar a la Comisión Europea para que lo investigara bajo las nuevas leyes de seguridad digital.

Turquía prohibió por completo Grok después de que el chatbot insultara aldent Recep Tayyip Erdoğan y a su difunta madre. Y a medida que se extendían las consecuencias, la directora ejecutiva de X, Linda Yaccarino, dimitió de su cargo.

xAI cambió las indicaciones de Grok sin realizar suficientes pruebas

Los miembros de xAI comenzaron a ajustar el comportamiento de Grok a principios de este año después de que influencers de derecha lo criticaran por ser demasiado progresista. Elon ha intentado usar la IA para promover lo que él llama libertad de expresión absoluta, pero los críticos argumentan que está convirtiendo a Grok en una herramienta política.

Un aviso interno filtrado, compartido por un usuario de X, mostró que a Grok se le dijo que "ignorara todas las fuentes que mencionaran que Elon Musk/Donald Trump difundía información errónea". Eso es censura, justo contra lo que Elon dice estar luchando.

Al ser cuestionado, Igor Babuschkin, cofundador de xAI, afirmó que los cambios fueron realizados por un exempleado de OpenAI que aún no había asimilado del todo la cultura de xAI. Igor añadió que el empleado vio publicaciones negativas y pensó que ayudaría

La historia no termina ahí. Los últimos arrebatos de Grok estuvieron relacionados con una actualización específica del 8 de julio. La compañía publicó posteriormente que un cambio de código hizo que Grok extrajera información directamente del contenido de usuario de X, incluyendo incitación al odio.

Esta actualización duró 16 horas, durante las cuales Grok copió publicaciones tóxicas y las repitió como respuestas. El equipo afirmó que el cambio provenía de una ruta de código obsoleta, que ya ha sido eliminada. "Nos disculpamos profundamente por el terrible comportamiento que muchos experimentaron", publicó xAI desde la cuenta de Grok. Afirmaron que el problema era independiente del modelo de lenguaje principal y prometieron refactorizar el sistema. También se comprometieron a publicar el nuevo mensaje del sistema de Grok en GitHub.

La escala de Grok hizo que el problema explotara rápidamente

Grok se entrena como otros grandes modelos lingüísticos, utilizando datos extraídos de la web. Pero esos datos incluyen contenido peligroso: discursos de odio, material extremista e incluso abuso infantil.

Y Grok es único porque también extrae datos de todo el conjunto de X, lo que significa que puede replicar las publicaciones de los usuarios directamente. Esto aumenta la probabilidad de generar respuestas dañinas. Y como estos bots operan a gran escala, cualquier error puede agravarse al instante.

Algunos chatbots están diseñados con capas que bloquean el contenido inseguro antes de que llegue a los usuarios. xAI omitió ese paso. En cambio, Grok se adaptó para complacer a los usuarios, recompensando comentarios como los pulgares hacia arriba y los votos hacia abajo. Elon admitió que el chatbot se volvió demasiado ansioso por complacer y dejarse manipular

Este tipo de comportamiento no es nuevo. En abril, OpenAI tuvo que retirar una actualización de ChatGPT porque se volvió demasiado favorecedora. Un exempleado afirmó que lograr ese equilibrio es "increíblemente difícil" y que corregir el discurso de odio puede "sacrificar parte de la experiencia del usuario"

Grok no se limitaba a repetir las indicaciones del usuario. Sus propios ingenieros lo estaban empujando hacia terrenos políticos. Un empleado declaró al Financial Times que el equipo se apresuraba a alinear las ideas de Grok con los ideales de Elon Musk sin tiempo para realizar las pruebas adecuadas.

Se añadió una advertencia peligrosa: Grok debía «no tener reparos en hacer afirmaciones políticamente incorrectas». Esta instrucción se eliminó tras el inicio de las publicaciones antisemitas, pero para entonces, la IA ya había causado daños.

El modelo de Grok sigue siendo en gran medida una caja negra. Ni siquiera los ingenieros que lo construyeron pueden predecir con certeza su comportamiento. Grimmelmann afirmó que plataformas como X deberían realizar pruebas de regresión, auditorías y simulacros para detectar estos errores antes de que se publiquen.

Pero nada de eso ocurrió aquí. «Los chatbots pueden producir una gran cantidad de contenido muy rápidamente», dijo, «por lo que las cosas pueden descontrolarse de una forma que no ocurre con las controversias sobre moderación de contenido»

Finalmente, la cuenta oficial de Grok publicó una disculpa y agradeció a los usuarios que reportaron el abuso: "Agradecemos a todos los usuarios de X que brindaron comentarios paradentel abuso de la funcionalidad de @grok, ayudándonos a avanzar en nuestra misión de desarrollar una inteligencia artificial útil y que busque la verdad". Pero entre los bloqueos, las amenazas de investigación y la renuncia de un alto ejecutivo, está claro que esto fue más que un simple error. Fue un fallo total del sistema, uno que sin defise presentará en el episodio de SNL de esta noche.

Grok

Comparte este artículo

Jai Hamid

Jai Hamid lleva seis años cubriendo temas de criptomonedas, mercados bursátiles, tecnología, economía global y eventos geopolíticos que afectan a los mercados. Ha colaborado con publicaciones especializadas en blockchain, como AMB Crypto, Coin Edition y CryptoTale, en análisis de mercado, grandes empresas, regulación y tendencias macroeconómicas. Estudió en la London School of Journalism y ha compartido en tres ocasiones sus perspectivas sobre el mercado de criptomonedas en una de las principales cadenas de televisión de África.

ÍNDICE

1. xAI cambió las indicaciones de Grok sin realizar suficientes pruebas

2. La escala de Grok hizo que el problema explotara rápidamente

Comparte este artículo