OpenAI의 Operator 에이전트가 새로운 AI 모델로 성능이 향상되었습니다

콜린스

J. 오코스 지음

읽는 데 3분 소요 , 2025년 5월 24일

OpenAI의 Operator 에이전트가 새로운 AI 모델로 성능이 향상되었습니다

OpenAI는 웹을 사용하여 작업을 수행하는 AI 에이전트인 Operator를 기존의 GPT-4o 맞춤형 버전에서 o3 기반 모델로 업그레이드했습니다.
o3 운영자는 컴퓨터 사용을 위한 추가 안전 데이터를 통해 미세 조정되었으며, 여기에는 모델의 결정 경계를 학습하도록 설계된 안전 데이터 세트가 포함됩니다.
아크 프라이즈 재단의 공동 설립자인 마이크 크누프는 o3 모델을 운영하는 데 예상보다 비용이 더 많이 들 수 있다고 생각합니다.

OpenAI는 Operator에 탑재된 AI 모델을 기존의 맞춤형 GPT-4o 버전에서 OpenAI의 최신 '추론' 모델 시리즈 중 하나인 o3 기반 모델로 업데이트했습니다. o3 기반 Operator는 컴퓨터 사용을 위한 추가적인 안전 데이터를 통해 미세 조정되었으며, 모델의 의사결정 경계를 학습하도록 설계된 안전 데이터 세트가 포함되었습니다.

OpenAI는 업그레이드했습니다 . 새로운 모델을 통해 운영자는 브라우저와의 상호 작용 시 더욱 지속적이고 정확해졌으며, 전반적인 작업 성공률이 향상되었습니다. 또한, 더욱 명확하고 상세한 구조화된 답변을 제공합니다.

OpenAI 에 따르면 , 새로운 CUA 모델은tron업계 평균 대비 우수한 성능을tron기존 벤치마크 및 사용자 선호도 평가 모두에서 이전 버전 대비 상대적으로 우수한 성능을 주며 OSWorld와 WebArena에서 최고 성능(SOTA)을 달성했습니다. 또한

OpenAI는 GPT-4o 기반 모델을 o3 기반 버전으로 교체했습니다

OpenAI가 ChatGPT 운영자 에이전트의 대규모 업그레이드를 예고했습니다 . pic.twitter.com/iGPQp9butD

— SabatAge(@sabatage) 2025년 5월 22일

OpenAI는 Operator에 사용되던 기존 GPT-4o 기반 모델을 OpenAI o3 기반 버전으로 교체했지만, API 버전은 4o를 계속 사용할 예정입니다. 또한 OpenAI는 o3 기반 Operator가 4o 버전과 동일한 다층 보안 방식을 사용한다고 밝혔습니다.

하지만 o3 제품군의 다른 모델들과 비교했을 때, o3 Operator는 컴퓨터 사용을 위한 추가적인 안전 데이터를 통해 더욱 정밀하게 조정되었으며, 여기에는 확인 및 거부 시 모델의 결정 경계를 학습시키도록 설계된 안전 데이터 세트가 포함됩니다.

OpenAI는 o3 Operator의 특정 안전성 평가 성능을 보여주는 기술 보고서를 발표했습니다. GPT-4o Operator 모델과 비교했을 때, o3 Operator는 "불법" 활동을 거부하거나 민감한 개인 정보를 검색하는 경향이 적었고, "프롬프트 인젝션"으로 알려진 AI 공격 유형에도 덜 취약한 것으로 나타났습니다.

"o3 Operator는 Operator 4o 버전에서 사용했던 것과 동일한 다계층 보안 접근 방식을 사용합니다... o3 Operator는 o3의 코딩 기능을 계승하지만, 코딩 환경이나 터미널에 대한 기본 접근 권한은 제공하지 않습니다."

–오픈아이

AI 업체는 또한 새로운 o3 기반 모델이 표준 안전성 평가를 거쳤으며, Operator는 전 세계 ChatGPT Pro 사용자에게 연구용 미리보기 버전으로 계속 제공될 것이라고 밝혔습니다. 다만, 이 업그레이드된 모델은 ChatGPT의 Operator에서만 사용할 수 있습니다.

크누프는 오픈아이얼의 o3 모델을 실행하는 데 예상보다 비용이 더 많이 들 수 있다고 생각합니다

지난주, ARC-AGI를 유지 및 관리하는 아크 프라이즈 재단(Arc Prize Foundation)은 o3의 대략적인 컴퓨팅 비용을 업데이트했습니다. 재단은 당초 테스트에서 가장 성능이 뛰어난 o3 구성인 o3 high를 사용하여 단일 ARC-AGI 문제를 해결하는 데 약 3,000달러가 소요될 것으로 추산했습니다. 그러나 재단은 이제 비용이 기존 추산치보다 10배 더 높을 수 있으며, 작업당 약 30,000달러에 이를 가능성이 있다고 보고 있습니다.

또한, OpenAI는 아직 o3의 가격을 발표하거나 정식 출시하지 않았지만, 아크 프라이즈 재단의 공동 설립자 중 한 명인 마이크 크눕은 o1-pro 모델의 가격이 o3의 실제 비용을 가늠하는 적절한 지표이며 더 근접한 비교 대상이라고 생각합니다. 그러나 그는 공식 가격이 발표될 때까지 불확실성을 반영하여 리더보드에서 o3를 계속해서 '미리 보기'로 표시할 것이라고 덧붙였습니다.

아크 프라이즈 재단에 따르면, o3 high 모델이 사용하는 컴퓨팅 자원의 양을 고려할 때 높은 가격이 책정되는 것은 놀라운 일이 아닙니다. o3 high는 ARC-AGI 문제를 해결하기 위해 o3의 가장 낮은 컴퓨팅 구성인 o3 low보다 172배 더 많은 컴퓨팅 자원을 사용했습니다.

소문이 돌았습니다 . 보도에 따르면, 오픈AI는 소프트웨어 개발자용 에이전트와 같은 특수 AI "에이전트"에 대해 월 최대 2만 달러까지 청구할 수 있다고 합니다.

하지만 일부에서는 오픈AI의 가장 비싼 모델조차도 일반적인 인간trac나 직원이 받는 비용보다 훨씬 저렴할 것이라고 주장했지만, AI 연구원 토비 오드는 모델의 효율성이 떨어질 수 있다고 지적했습니다. 예를 들어, o3 high 모델은 ARC-AGI에서 각 작업을 최고 점수로 완료하기 위해 1,024번의 시도가 필요했습니다.

암호화폐 뉴스를 단순히 읽는 데 그치지 마세요. 이해하세요. 저희 뉴스레터를 구독하세요. 무료입니다.

오픈아이

이 기사를 공유하세요

콜린스 J. 오코스

콜린스 오코스는 암호화폐 및 기술 분야를 8년간 취재해 온 저널리스트이자 시장 분석가입니다. 그는 공인재무분석사(CFA) 자격증을 보유하고 있으며, 보험계리matic학위도 소지하고 있습니다. 콜린스는 이전에 Geek Computer와 CoinRabbit에서 작가 및 편집자로 근무했습니다.

1. OpenAI는 GPT-4o 기반 모델을 o3 기반 버전으로 교체했습니다

2. 크누프는 오픈아이얼의 o3 모델을 실행하는 데 예상보다 비용이 더 많이 들 수 있다고 생각합니다

이 기사를 공유하세요