OpenAI의 CEO인 샘 알트만은 몇 달 동안 GPT-5에 대한 기대감을 높여왔습니다. 그는 GPT-5가 더욱 발전된 모델로, 더 똑똑하고 빠르며 "박사 수준의 사고 능력"을 갖추고 있다고 주장했습니다. 회사는 GPT-5 출시를 ChatGPT의 중요한 도약으로 내세우며, 코딩, 추론 및 정확도 측면에서 지능 향상을 가져올 것이라고 강조했습니다.
하지만 초기 반응은 다소 엇갈 . 개발자들은 GPT-5가 복잡한 명령어를 이해하고 구조가 잘 잡힌 코드를 출력하는 점을 칭찬했습니다. 초기 테스터인 사이먼 윌리슨은 GPT-5를 "능숙하고" "때때로 인상적"이지만 GPT-4에서 크게 발전한 것은 아니라고 평가했습니다. 다른 사람들은 그다지 감명받지 못했습니다.
소셜 미디어에 올라온 여러 게시물은 사실 오류, 허술한 수학 실력, 심지어 기본적인 철자 오류까지 지적하며 불만을 쏟아냈습니다. 벤틀리 대학교의 수학 교수인 노아 지안시라쿠사는 이번 발표를 "실망스럽다"고 평가하며, 문제의 업데이트 내용이 "기대했던 것보다 훨씬 부실하다"고 지적했습니다
혼란의 일부는 모델의 아키텍처 때문이었습니다. GPT-5는 다양한 모델 크기를 . 이는 처리량을 줄여주며, 항상 전체 GPT-5 모델을 사용하지 않도록 해줍니다. 이로 인해 많은 사람들이 취약점을 발견하게 되었습니다. 시스템이 질문에 잘못 답했을 때, 해당 시스템과 연동된 에이전트는 블루베리에 "b"가 몇 개 있는지 "더 생각해 보라"고 지시했습니다. 이러한 피드백을 받은 후에는 질문에 대한 정답을 맞혔습니다.
사용자들의 반발에 OpenAI가 대응했다
금요일까지 Reddit과 X 플랫폼으로 불만이 확산될 수도 있습니다. 일부 사용자는 텍스트가 어떤 모델에서 생성되었는지조차 알 수 없다는 점을 불만으로 꼽았고, 많은 사용자는 지옥이 단지 추론에 불과하며 GPT5가 기존에 신뢰하던 모델들을 대체했다고 느꼈습니다. 몇몇 사용자는 품질이 저하되었다고 지적하며, 글쓰기 품질이 GPT-4.5 , 이는 사용자들도 동의한 부분입니다. 또한 일부 창의적이고 기술적인 부분에서 성능이 저하된 것처럼 느껴졌습니다.
이 대화로 인해 OpenAI의 CEO는 레딧에서 진행된 "무엇이든 물어보세요(Ask Me Anything)" 세션에 참여하여 반발에 대해 해명했습니다. 그는 자동 전환 기능의 버그로 인해 GPT-5가 출시 첫날에는 잠재력을 최대한 발휘하지 못했다고 설명했습니다. 또한 향후 모델 전환 과정에서 더 투명하게 공개하겠다고 약속하며, "오늘부터 GPT-5는 점점 더 똑똑해지는 모습을 보여줄 것입니다."라고 밝혔습니다. OpenAI는 가장 강력한 비판을 제기한 사용자들을 달래기 위해 GPT-40과 같은 이전 모델을 다시 배포하겠다고도 약속했습니다.
이처럼 신속하게 행동해야 했다는 사실 자체가 상황의 심각성을 보여줍니다. 현재 OpenAI는 Anthropic, Google DeepMind, 심지어 일론 머스크의 xAI와 같은 경쟁사들과 숨 막힐 듯한 경쟁을 벌이고 있습니다. 치열한 경쟁 속에서 작은 실수라도 하면 순식간에 경쟁사가 앞서 나갈 수 있습니다.
인공지능 경쟁이 더욱 치열해지고 있다
이러한 차이점에도 불구하고 GPT-5에 대한 반응은 미지근했지만, 사용자 주도형 모델 학습 순위표인 LMArena에서 1위를 차지하는 데에는 성공했습니다. 오늘날 우리가 생각하는 프로그래밍 가능한 모델과는 달랐지만, GPT-5는 매우 빠르고 표현력이 풍부했으며, 크고 복잡한 쿼리를 지원했습니다. 그러나 다른 벤치마크에서는 훨씬 더 어려운 문제 환경이 드러났습니다. 머스크의 xAI ARC-AGI-2(고급 추론 테스트 세트)에서 매우 높은 점수를 기록하며 OpenAI의 아성을 위협했습니다.
일부 업계 분석가들은 GPT-5의 효과가 완전히 이해되려면 GPT-3와 같은 이전 제품들처럼 최소 하루는 걸릴 것으로 예상합니다. GPT-5와 GPT-4는 업데이트와 다른 활용 사례를 통해 개선되기 전까지 상당한 비판을 받았습니다. 이 모델은 사람들의 일상적인 업무 흐름에 얼마나 유용한지에 따라 성공(또는 실패) 여부가 결정될 것이며, 전 세계적으로 매주 약 7억 명의 ChatGPT 사용자가 있습니다.
와튼 스쿨의 에단 몰릭 교수는 이렇게 말했습니다. "GPT-5는 때로는 놀라운 일들을, 때로는 이해하기 어려운 일들을, 완전히 스스로 해냅니다. 바로 그 점이 GPT-5를 매우 흥미롭게 만드는 것입니다. 공중 보건 분야의 이런 것들을 '흥미롭다'라고 부르는 것은 여전히 기술관료적이고 다소 섬뜩한 접근 방식입니다."

