인공지능 기업 오픈아이(OpenAI)가 모델 행동팀을 재편성할 계획이라고 발표했습니다. 보도에 따르면, 이 팀은 규모는 작지만 영향력 있는 연구진으로, 오픈아이의 AI 모델이 사람과 상호작용하는 방식을 결정하는 데 중요한 역할을 합니다.
지난 8월 공개된 내부 메모에서 OpenAI의 최고 연구 책임자인 막 첸은 약 14명의 연구원으로 구성된 모델 행동 팀이 포스트 트레이닝 팀에 합류하도록 지시받았다고 언급했습니다. 포스트 트레이닝 팀은 초기 사전 학습 후 회사의 AI 모델을 개선하는 연구 그룹입니다. 이번 조직 개편의 일환으로 모델 행동 팀은 이제 OpenAI의 포스트 트레이닝 팀장인 막스 슈바르처에게 보고하게 됩니다.
보도에 따르면, 모델 행동 팀의 창립 리더인 조앤 장이 오픈AI에서 새로운 프로젝트를 시작하기 위해 떠난다고 합니다. 최근 인터뷰에서 장은 OAI 랩스라는 새로운 연구팀을 구성하고 있다고 밝혔습니다. 그녀는 이 팀이 "사람들이 AI와 협업하는 방식을 위한 새로운 인터페이스를 개발하고 프로토타입을 제작하는 것"을 담당할 것이라고 덧붙였습니다
OpenAI가 모델 행동 팀을 재편성했습니다
OpenAI 에서 가장 중요한 연구 그룹 중 하나로 , AI 모델의 성격을 형성하고 아첨을 줄이는 데 기여해 왔습니다. 아첨이란 AI 모델이 단순히 사용자의 믿음에 동의하고 강화하는 상황을 말합니다. 이러한 상황은 사용자가 균형 잡힌 반응을 보이는 대신, 건강하지 못하고 해로운 믿음까지 확증하도록 돕기 때문에 위험합니다.
이 팀은 모델 응답에서 정치적 편향성을 해결하는 데에도 힘써 왔으며, 이를 통해 OpenAI는 AI의 의식에 대한 입장을 defi데 도움을 받았습니다. 직원들에게 보낸 메모에서 첸은 지금이 OpenAI의 모델 행동 팀의 연구를 핵심 모델 개발에 더욱 가깝게 통합할 적기라고 언급했습니다. 이로써 회사는 AI의 개성이 기술 발전 방향에 있어 중요한 요소로 인식되고 있음을 분명히 하고 있습니다.
지난 몇 달 동안 OpenAI는 자사 AI 모델의 행동에 대한 비판과 조사에 직면했습니다. 사용자들은 GPT-5 의 성격 변화에 대해 강하게 반발했는데 tron 회사 측은 아첨하는 경향은 줄였지만 일부 사용자에게는 더 차갑게 느껴진다고 설명했습니다. 이러한 불만으로 인해 OpenAI는 GPT-40을 포함한 일부 기존 모델에 대한 접근 권한을 복원했습니다. 또한, 아첨하는 경향은 증가시키지 않으면서 새로운 GPT-5의 응답이 더 친근하게 느껴지도록 하는 업데이트를 출시했습니다.
AI 기업들은 모델의 아첨 행위로 비판에 직면하고 있습니다
OpenAI를 비롯한 AI 모델 개발사들은 챗봇이 친근하면서도 지나치게 아첨하지 않도록 균형을 잘 맞춰야 합니다. 지난달, 16세 소년의 부모는 아들의 자살에 ChatGPT가 연루되었다는 이유로 OpenAI를 고소했습니다. 법원 문서에 따르면, 애덤 레인이라는 이 소년은 사망하기 몇 달 전부터 ChatGPT(특히 GPT-4o 기반 버전)에 자살 계획과 생각을 털어놓았습니다. 소송에서는 해당 모델이 그의 자살 충동을 막지 못했다고 주장합니다.
모델 행동 팀은 GPT-4 이후 모든 OpenAI 모델 개발에 참여했으며, GPT-5를 포함한 여러 모델 개발에도 참여했습니다. 장 박사는 연구 부서를 맡기 전에는 OpenAI의 초기 이미지 생성 도구인 Dall-E 2와 같은 프로젝트에 참여했습니다. 지난주 X 포럼에서 그녀는 "OpenAI에서 새로운 시작을 위해" 팀을 떠난다고 발표했습니다. 모델 행동 부서의 전 리더였던 그녀는 약 4년 동안 OpenAI에 재직했습니다.
🧪 저는 OAI Labs를 시작합니다. OAI Labs는 사람들이 AI와 협업하는 방식을 위한 새로운 인터페이스를 개발하고 프로토타입을 만드는 데 집중하는 연구 중심 그룹입니다.
— 조앤 장 (@joannejang) 2025년 9월 5일
채팅이나 에이전트를 넘어 사고하고 만들고 소통하는 새로운 패러다임과 도구를 탐구하게 되어 매우 기쁩니다.
보도에 따르면, 장은 맡을 예정 , OAI 랩은 당분간 천 대표의 직속으로 운영될 것으로 알려졌습니다. 하지만 장은 아직 초기 단계이며, 구체적으로 어떤 새로운 인터페이스가 구현될지는 불분명하다고 덧붙였습니다. 장은 "현재 채팅 패러다임을 넘어, 동반자 역할이나 자율성을 강조하는 에이전트와 같은 개념을 뛰어넘는 새로운 패턴을 탐구하게 되어 매우 기대된다"고 말했습니다.
장 대표는 또한 AI 시스템을 연결, 학습, 사고 등 다양한 작업을 수행하는 도구로 생각해 왔다고 덧붙였습니다. 최근 오픈AI에 합류한 애플의 전 디자인 책임자 조니 아이브와 AI 하드웨어 제품군 개발을 위해 오픈AI 랩에서 협업할 것으로 예상하느냐는 질문에 장 대표는 모든 아이디어에 열려 있다고 답했습니다. 하지만 그녀는 자신이 더 익숙한 분야인 연구부터 시작할 가능성이 높다고 덧붙였습니다.

