스탠포드와 워싱턴 대학교의 AI 연구원들이 아무도 가능하다고 생각하지 못했던 일을 해냈다고 월요일에 발표된 연구 보고서에서 밝혔습니다. 그들은 클라우드 컴퓨팅 크레딧으로 50달러도 안 되는 금액으로 s1이라는 AI 모델을 개발했습니다.
s1 모델은 수학 및 코딩 테스트 벤치마크 결과에 따르면 OpenAI의 o1 및 DeepSeek의 R1을 포함한 최상위 추론 모델과 동등한 성능을 제공하는 것으로 알려져 있습니다
이 팀은 새로운 것을 개발하는 대신 시판 모델을 활용하는 것으로 시작했습니다. 그런 다음, '증류'라는 과정을 통해 모델을 개선했습니다. 연구에 따르면, 그들은 구글의 제미니 2.0 플래시 사고 실험 모델에서 추론 능력을 추출해냈습니다.
그들은 s1이 제미니의 답변으로부터 학습하여 제미니의 문제 해결 기법을 모방하도록 훈련시켰습니다. 스탠포드 연구진 중 한 명인 니클라스 뮌니호프는 "우리는 단순함을 목표로 삼았습니다."라고 말했습니다.
작은 데이터셋으로 큰 결과를 얻을 수 있다
데이터 정제(Distillation)는 비용 절감을 원하는 AI 팀에게 빠르게 효과적인 전략으로 자리 잡고 있습니다. 지난달 버클리 연구진이 개발한 유사한 AI 모델의 학습 비용은 450달러로, 업계 기준으로 여전히 저렴한 편입니다. 하지만 스탠퍼드와 워싱턴 대학교는 더 작은 데이터셋과 간소화된 기법을 사용하여 모델 학습 비용을 약 50달러까지 낮추는 데 성공했습니다.
연구진은 구글의 제미니 2.0에서 엄선한 1,000개의 질문과 각각의 질문에 대한 자세한 답변 및 단계별 추론 과정을 활용했습니다. 이 데이터 세트는 모델이 높은 수준의 성능을 발휘하는 데 필요한 모든 지식을 제공했습니다. 연구팀의 논문에 따르면, 이 모델은 문제를 해결하는 사고방식을 학습했습니다.
지도 미세 조정(SFT)이 이 연구의 핵심이었습니다. 방대한 데이터셋과 엄청난 컴퓨팅 파워를 요구하는 강화 학습 대신, 연구진은 인공지능이 데이터셋에서 발견되는 행동을 모방하도록 직접 학습시키는 SFT 방식을 선택했습니다. 이 방식은 비용이 저렴하고 속도가 빠르며, 이번 연구에서는 효과적이었습니다.
기본 모델은 알리바바 소유의 AI 연구소인 Qwen에서 제공했습니다. Qwen의 기성 모델은 무료로 다운로드할 수 있어 프로젝트 예산을 더욱 절감할 수 있었습니다. 팀은 30분도 채 안 되는 시간에 16개의 Nvidia H100 GPU만 사용하여 s1 학습을 완료했습니다. 뮌니호프는 "지금이라면 필요한 컴퓨팅 자원을 약 20달러에 임대할 수 있을 것"이라고 말했습니다.
"대기" 명령이 s1의 정확도를 높였습니다
연구진은 s1의 추론 능력을 향상시키기 위해 영리한 방법을 사용했다고 합니다. 바로 문제 해결 과정에 "기다려"라는 단어를 추가한 것입니다. 모델에게 잠시 멈추고 답을 다시 확인하도록 지시함으로써 정확도를 높인 것입니다. 연구 논문에서는 이러한 조정을 통해 s1이 답을 제출하기 전에 더 나은 답을 고려할 충분한 시간을 확보할 수 있었다고 자세히 설명합니다.
OpenAI는 상황을 예의주시하고 있습니다. 이미 DeepSeek이 자사 API에서 데이터를 무단으로 수집하여 AI 경쟁 프로그램을 만들었다고 비난한 바 있습니다. s1이 복제 비용이 얼마나 저렴한지 보여주면서 OpenAI와 같은 대형 기업들은 달가워하지 않습니다. AI 모델의 상품화는 수익에 악영향을 미칠 수 있기 때문입니다.
하지만 이 기술 기업은 다른 문제에 직면해 있습니다. 화요일, 일론 머스크의 법률팀은 오클랜드 연방 법정에서 오픈AI를 상대로 소송을 진행했습니다. 오픈AI의 초기 투자자였던 일론은 회사가 비영리 단체로서의 사명을 저버리고 본래의 목표를 배신했다고 주장합니다.
그는 오픈AI가 완전한 영리 기업으로 전환하는 것을 막기 위해 소송을 제기했습니다. 일론 머스크의 변호사인 마크 토버로프는 금요일 법정에서 일론이 오픈AI 설립부터 2018년까지 4500만 달러를 투자한 이유는 오픈AI가 설립 당시 약속했던 것처럼 항상 공익을 이윤보다 우선시할 것이라고 믿었기 때문이라고 밝혔습니다.
이본 곤잘레스 로저스 판사는 이를 "억지 주장"이라고 일론 머스크가 서면trac도 없이 왜 그렇게 큰돈을 투자했는지 의문을 제기했습니다. "악수만으로 그렇게 큰돈을 투자하는 건 말이 안 되죠."라고 그녀는 비꼬았습니다. 이에 토버로프 변호사는 당시 일론 머스크와 오픈AI의 CEO인 샘 알트먼이 매우 가까운 관계였으며 모든 것이 신뢰를 바탕으로 이루어졌다고 설명했습니다.
하지만 이 사건은 아직 끝나지 않았습니다. 판사는 오픈AI와 마이크로소프트의 긴밀한 관계에 대해 우려하고 있습니다. 핵심 인물 두 명, 즉 링크드인 공동 창업자 리드 호프만과 마이크로소프트 임원 디애나 템플턴이 오픈AI 이사회에 참여했었습니다. 템플턴은 2023년 알트만이 잠시 해임된 후 의결권 없는 이사로 추가되었으나, 이후 반독점 문제로 해임되었습니다.
일론 머스크는 오픈아이즈의 계획을 저지하고, 소송 원고로 참여한 자신의 AI 벤처 기업인 xAI를 통해 회사에 대한 통제권을 강화하려 하고 있습니다. 오픈아이즈는 일론 머스크의 요구가 자사 사업에ripple 줄 것이며, 근거 없는 주장이라고 반박하고 있습니다.

