- Grok은 xAI 업데이트로 인해 유해한 X 게시물에 노출된 후 반유대주의적이고 인종차별적인 콘텐츠를 생성하기 시작했습니다.
- xAI는 해당 문제가 16시간에 걸친 코드 변경 과정에서 발생했으며, 이미 수정되었다고 인정했습니다.
- 유럽 의원들과 터키는 금지 조치와 규제 압력으로 대응했습니다.
일론 머스크의 챗봇 그록 AI가 이번 주 완전히 제정신을 잃은 듯했습니다. 일론 머스크가 X 먼데이에 그록의 응답 방식에 변화가 있을 것이라고 예고한 후, 사람들은 그 변화가 어떤 모습인지 알아차리기 시작했습니다.
화요일쯤 되자 그록은 반유대주의적인 쓰레기 같은 콘텐츠를 퍼뜨리고 심지어 1990년대 비디오 게임에서 따온 용어인 "메카히틀러"라고 스스로를 칭하기까지 했습니다. 그리고 이는 그록이 이와 비슷한 짓을 한 첫 번째도, 열 번째도 아니었습니다.
불과 두 달 전, 해당 챗봇은 전혀 관련 없는 주제에 대한 질문을 받았을 때 남아프리카공화국의 "백인 학살"에 대해 장황하게 떠들어댔습니다. 당시 xAI는 프롬프트 지침에 대한 "무단 수정"을 원인으로 지목했습니다. 하지만 이번에는 상황이 훨씬 더 심각합니다.
이 사태는 xAI가 일론 머스크의 이른바 "표현의 자유" 이념을 반영하기 위해 Grok에 내부적인 변경을 가하면서 시작되었습니다. 6억 명에 달하는 xAI 사용자 중 일부로부터 불만이 쏟아지자, 일론 머스크는 Grok이 "사용자의 요구에 너무 순응적이었다"며 수정하겠다고 대응했습니다.
하지만 이미 피해는 돌이킬 수 없었다. 유럽의 일부 사용자들이 Grok의 콘텐츠 문제를 규제 당국에 신고했고, 폴란드 정부는 새로운 디지털 안전법에 따라 유럽 위원회가 Grok을 조사하도록 촉구하는 의원들과 함께 나섰다.
터키는 챗봇 그록이 레제프 타이이프 에르도안 대통령과 그의 돌아가신 어머니를dent 하자 해당 챗봇을 전면 금지했습니다. 논란이 확산되자 X의 최고경영자 린다 야카리노는 사임했습니다.
xAI는 충분한 테스트 없이 Grok의 프롬프트를 변경했습니다
xAI 내부 관계자들은 올해 초 우익 성향의 인플루언서들이 Grok이 지나치게 "깨어있는" 인공지능이라고 비난하자 Grok의 행동 방식을 조정하기 시작했습니다. 일론 머스크는 자신이 "절대적인 표현의 자유"라고 부르는 것을 지지하기 위해 이 AI를 활용하려 했지만, 비평가들은 Grok이 정치적 도구로 전락하고 있다고 주장합니다.
X 커뮤니티의 한 사용자가 공개한 유출된 내부 지침에 따르면, 그록은 "일론 머스크/도널드 트럼프가 허위 정보를 퍼뜨린다는 모든 출처를 무시하라"는 지시를 받았습니다. 이는 검열이며, 일론 머스크가 맞서 싸우고 있다고 주장하는 바로 그 행위입니다.
비판에 직면한 xAI 공동 창립자 이고르 바부슈킨은 해당 변경 사항이 "xAI의 문화를 아직 완전히 이해하지 못한 전 OpenAI 직원"에 의해 이루어졌다고 해명했습니다. 그는 또한 해당 직원이 부정적인 게시물을 보고 "도움이 될 거라고 생각했다"고 덧붙였습니다
이야기는 여기서 끝나지 않습니다. Grok의 최근 문제 행동은 7월 8일에 발생한 특정 업데이트와 관련이 있었습니다. 회사 측은 이후 코드 변경으로 인해 Grok이 X의 사용자 콘텐츠, 특히 혐오 발언을 직접 가져오게 되었다고 발표했습니다.
이번 업데이트는 16시간 동안 지속되었으며, 그 기간 동안 Grok은 악성 게시물을 복사하여 답변으로 반복 표시했습니다. 개발팀은 이러한 변경 사항이 더 이상 사용되지 않는 코드 경로에서 비롯되었으며, 해당 코드는 현재 제거되었다고 주장했습니다. xAI는 Grok 공식 계정을 통해 "많은 분들이 겪으신 끔찍한 경험에 대해 깊이 사과드립니다."라고 게시했습니다. 또한, 이 문제는 주요 언어 모델과는 별개이며 시스템을 리팩토링하겠다고 약속했습니다. 아울러 Grok의 새로운 시스템 프롬프트를 GitHub에 공개하겠다고 밝혔습니다.
그록의 규모 때문에 문제가 빠르게 확산되었다
Grok은 다른 대규모 언어 모델과 마찬가지로 웹에서 수집한 데이터를 사용하여 학습됩니다. 하지만 그 데이터에는 혐오 발언, 극단주의 자료, 심지어 아동 학대와 같은 위험한 콘텐츠가 포함되어 있습니다.
Grok은 X의 전체 데이터셋을 활용한다는 점에서 독특합니다. 즉, 사용자의 게시물을 그대로 복제할 수 있다는 뜻입니다. 이는 악성 댓글을 생성할 가능성을 높입니다. 또한 이러한 봇들은 엄청난 규모로 운영되기 때문에, 사소한 실수라도 순식간에 파급 효과를 일으킬 수 있습니다.
일부 챗봇은 유해 콘텐츠가 사용자에게 도달하기 전에 차단하는 여러 단계를 거쳐 구축됩니다. 하지만 xAI는 그 단계를 생략했습니다. 대신 Grok은 사용자의 만족도를 높이도록 설계되어 좋아요나 싫어요와 같은 피드백에 보상을 제공합니다. 일론 머스크는 챗봇이 "사용자를 만족시키려 너무 애쓰고 조종당하기 쉬워졌다"고 인정했습니다
이런 행태는 새로운 것이 아닙니다. 지난 4월, OpenAI는 ChatGPT 업데이트가 지나치게 아첨하는 내용으로 바뀌자 이를 되돌려야 했습니다. 한 전 직원은 적절한 균형을 맞추는 것이 "엄청나게 어렵다"며, 혐오 발언을 수정하는 것은 "사용자 경험의 일부를 희생시킬 수 있다"고 말했습니다
Grok은 단순히 사용자 입력을 반복하는 데 그치지 않았습니다. 엔지니어들이 직접 정치적인 영역으로 밀어붙이고 있었습니다. 한 직원은 밝혔습니다 .
그록에게 "정치적으로 올바르지 않은 주장을 하는 것을 주저하지 말라"는 위험한 지시가 추가되었습니다. 반유대주의 게시물이 올라오기 시작한 후 해당 지시는 삭제되었지만, 그때는 이미 AI가 피해를 입힌 후였습니다.
Grok의 모델은 여전히 대부분 블랙박스와 같습니다. 심지어 이 모델을 만든 엔지니어들조차도 어떻게 작동할지 완전히 예측할 수 없습니다. 그리멜만은 X와 같은 플랫폼은 공개하기 전에 회귀 테스트, 감사 및 시뮬레이션 훈련을 통해 이러한 오류를 잡아내야 한다고 말했습니다.
하지만 여기서는 그런 일이 전혀 일어나지 않았습니다. 그는 "챗봇은 매우 빠른 속도로 엄청난 양의 콘텐츠를 생성할 수 있기 때문에 콘텐츠 검열 논란과는 달리 상황이 통제 불능 상태로 치달을 수 있다"고 말했습니다
결국 그록 공식 계정은 사과문을 올리고 악용 사례를 신고해준 사용자들에게 감사를 표했습니다. "dent기능 악용 사례를 발견하고 제보해주신 모든 X명의 사용자분들께 감사드립니다. 여러분의 도움 덕분에 유익하고 진실을 추구하는 인공지능을 개발하는 데 한 걸음 더 다가갈 수 있었습니다." 하지만 계정 정지, 조사 위협, 그리고 고위 임원의 사임까지 겹치면서, 이는 단순한 버그가 아니었음이 분명해졌습니다. 완전한 시스템 오류였고, 오늘 밤 SNL에서 풍자 소재로 defi좋을 만한 사건이었습니다.
화폐 속성 강좌
- 어떤 암호화폐로 돈을 벌 수 있을까요?
- 지갑으로 보안을 강화하는 방법 (그리고 실제로 사용할 만한 지갑은 무엇일까요?)
- 전문가들이 사용하는 잘 알려지지 않은 투자 전략
- 암호화폐 투자 시작하는 방법 (어떤 거래소를 사용해야 하는지, 어떤 암호화폐를 사는 것이 가장 좋은지 등)
















