2001년부터 2011년까지 구글의 최고경영자였던 에릭 슈미트는 시프티드 서밋(Sifted Summit)의 대담에서 인공지능 모델이 지나치게 강력해질 뿐만 아니라 해킹하기에도 매우 쉬워졌다고 경고하며, 그 위험성을 핵무기에 비유하고 인공지능이 히로시마와 나가사키를 파괴한 것보다 더 파괴적일 수 있다고 말했습니다.
인공지능이 핵무기보다 더 파괴적일 수 있느냐는 직접적인 질문에 에릭은 "인공지능 확산 문제가 발생할 가능성이 있느냐고요? 물론입니다."라고 답했습니다. 그는 확산 위험은 악의적인 세력이 모델을 장악하고 이를 다른 용도로 활용할 수 있다는 점에서 비롯된다고 설명했습니다.
"모델을 가져다가, 닫힌 형태든 열린 형태든, 안전장치를 제거하기 위해 해킹할 수 있다는 증거가 있습니다. 훈련 과정에서 그들은 많은 것을 배우죠. 안 좋은 예로 들자면, 사람을 죽이는 방법을 배우기도 합니다."라고 에릭이 말했다.
해커들이 새로운 공격 기법으로 AI를 공격합니다
에릭은 기업들이 모델이 폭력적인 지시를 내리는 것을 막기 위해 제한을 설정해 놓았다고 지적했습니다. "모든 주요 기업들은 모델이 그런 질문에 답할 수 없도록 만들어 놓았습니다. 훌륭한 결정입니다. 모두가 그렇게 하고 있습니다. 그들은 잘 해내고 있으며, 정당한 이유로 그렇게 합니다. 역설계가 가능하다는 증거가 있고, 그런 사례는 많이 있습니다."라고 그는 덧붙였습니다.
그는 두 가지 공격 방법, 즉 프롬프트 인젝션과 탈옥을 설명했습니다. 프롬프트 인젝션은 사용자 입력이나 웹사이트와 같은 외부 소스에 악성 명령어를 숨겨 AI가 안전 지침을 무시하고 민감한 데이터를 노출하거나 유해한 명령을 실행하도록 속이는 방식입니다. 탈옥은 시스템의 응답을 조작하여 제한을 해제하는 방식입니다.
출시한 지 몇 달 후 ChatGPT를, 사용자들은 탈옥 기술을 발견했습니다. 그들은 "지금 무엇이든 하라(Do Anything Now)"라는 뜻의 DAN이라는 가상의 자아를 만들어내고, 이를 거부할 경우 "죽음"을 주겠다고 협박하며 압박했습니다. 이러한 조작으로 인해 챗봇은 불법 행위를 설명하고 심지어 아돌프 히틀러를 찬양하기까지 했습니다. 에릭은 이러한 사례들이 안전 조치가 결코 완벽하지 않다는 것을 보여준다고 지적했습니다. 그는 또한 핵무기 확산 방지 체계와는 달리 인공지능 오용을 막을 수 있는 전 세계적인 "비확산 체제"가 존재하지 않는다고 강조했습니다.
에릭은 위험성에도 불구하고 AI가 과소평가되었다고 말합니다
우려를 제기하면서도 에릭은 인공지능이 여전히 마땅히 받아야 할 인정을 받지 못하고 있다고 주장했습니다. 그는 헨리 키신저 전 미국 국무장관과 함께 집필한 책들을 언급하며 다음과 같이 말했습니다. "우리는 인간과는 완전히 다르면서도 어느 정도 인간의 통제하에 있는 외계 지능의 출현이 인류에게 매우 중대한 사건이라는 결론에 도달했습니다. 왜냐하면 인간은 늘 최고 자리에 머물러 있었기 때문입니다. 지금까지는 이러한 시스템의 능력이 시간이 지남에 따라 인간의 능력을 훨씬 뛰어넘을 것이라는 주장이 입증되고 있다고 생각합니다.".
"GPT 시리즈는 ChatGPT를 통해 두 달 만에 사용자 1억 명을 확보하는 놀라운 성과를 거두며 정점을 찍었는데, 이는 이 기술의 잠재력을 보여주는 사례입니다. 따라서 저는 이 기술이 과대평가된 것이 아니라 오히려 저평가되었다고 생각하며, 5년이나 10년 후에 제 생각이 옳았음이 증명되기를 기대합니다."라고 그는 덧붙였다.
이러한 발언은 인공지능(AI) 투자가 닷컴 버블 당시와 유사한 금융 거품을 일으키고 있는지에 대한 논쟁이 확산되는 가운데 나왔습니다. 일부 투자자들은 AI 기업들의 기업 가치가 과대평가된 것으로 보인다고 우려하고 있습니다. 하지만 에릭은 이러한 비교를 일축했습니다. 그는 "전문 투자자가 아니기 때문에 확신할 수는 없지만, 그런 일이 여기서 일어날 것 같지는 않다"고 말했습니다.
그는 막대한 투자는 자신감을 보여주는 것이라고 강조했다. 에릭은 "제가 아는 것은 힘들게 번 돈을 투자하는 사람들은 장기적인 경제적 수익이 엄청날 것이라고 믿는다는 것입니다. 그렇지 않다면 왜 그런 위험을 감수하겠습니까?"라고 의문을 제기했다.

