딥시크 V4는 최고 수준의 코딩 작업을 목표로 하는 장시간 컨텍스트 코딩 분야에서 챗GPT와 클로드를 능가하는 성능을 보일 것으로 예상됩니다. 내부 관계자들은 2월 중순 출시 후 예상되는 성능이 내부 테스트에서 드러난다면 실리콘 밸리의 AI 업계가 긴장해야 할 것이라고 주장합니다.
중국에 본사를 둔 AI 스타트업 딥시크(DeepSeek)가 최신 대규모 언어 모델인 딥시크 V4를 2월 17일에 출시할 예정이라고 합니다. 관계자들에 따르면, 이 모델은 긴 문맥의 코드 입력 및 작업을 처리하는 데 있어 오픈아이(OpenAI)의 챗GPT(ChatGPT)나 앤스로픽(Anthropic)의 클로드(Claude)와 같은 기존 대규모 언어 모델들을 위협할 것으로 예상됩니다.
개발자들이 DeepSeek V4 출시를 매우 기대하고 있다고 밝혔습니다
중국 기업은 현재까지 출시 임박에 대한 어떠한 정보도 공개하지 않았으며, 소문에 대해서도 확인해주지 않았습니다. 다양한 소셜 네트워크에서 개발자들은 출시를 매우 기대하고 있다는 반응을 보이고 있습니다. AI 개발자이자 Hyperbolic Labs의 공동 창립자인 Yuchen Jin은 썼습니다 로 곧 출시될 것이라는 소문이 있다tron.
서브레딧 r/DeepSeek에서도 논쟁이 뜨겁게 달아 올랐는데, 한 사용자가 DeepSeek의 곧 출시될 V4 모델에 대한 자신의 집착이 정상적이지 않다고 설명했습니다. 이 사용자는 "뉴스, 루머를 자주 확인하고, 심지어 DeepSeek 웹사이트의 문서까지 읽으면서 업데이트를 암시하는 변경 사항이나 징후를 찾는다"고 말했습니다.
딥시크의 이전 제품 출시는 글로벌 시장에 상당한 영향을 미쳤습니다. 이 중국 AI 스타트업은 출시하여 수조 달러 규모의 매도세를 불러일으켰습니다. 이 모델은 오픈AI의 01 모델과 수학 및 추론 벤치마크에서 동등한 성능을 보였으며, 개발 비용은 오픈AI가 01 모델 개발에 투자한 비용보다 훨씬 적었습니다.
중국 기업은 해당 모델 출시에 단 6백만 달러만 투자한 것으로 알려졌습니다. 반면, 글로벌 경쟁사들은 동일한 결과물을 얻기 위해 거의 70배에 달하는 비용을 지출합니다. 또한, DeepSeek의 V3 모델은 MATH-500 벤치마크에서 90.2%의 점수를 기록했는데, 이는 Claude의 78.3%보다 높은 수치입니다. DeepSeek의 최신 V3 업그레이드 버전(V3.2 Speciale)은 생산성을 더욱 향상시켰습니다.
V4 모델의 강점은 V3 모델의 순수 추론, 형식적 증명 및 논리적 수학에 대한 강조에서 발전했습니다. 새로운 버전은 추론 및 비추론 작업을 모두 결합한 하이브리드 모델이 될 것으로 예상됩니다. 이 모델은 높은 정확도와 긴 컨텍스트 코드 생성을 요구하는 개발자 시장의 공백을 메워 공략하는 것을 목표로 합니다.
Claude Opus 4.5는 SWE 벤치마크에서 80.9%의 정확도를 기록하며 선두 자리를 지키고 있습니다. V4가 Claude Opus 4.5를 넘어서려면 이 수치를 뛰어넘어야 합니다. 이전 성공 사례를 보면, 출시 예정인 V4 모델은 이 기준점을 넘어서 벤치마크에서 우위를 점할 가능성이 높습니다.
DeepSeek은 LLM 교육을 위한 mHC를 개척했습니다
딥시크의 성공은 많은 전문가들을 놀라게 했습니다. 어떻게 이렇게 작은 회사가 이토록 큰 성과를 거둘 수 있었을까요? 그 비결은 발표된 1월 1일에dent. 딥시크의 창립자이자 CEO인 량원펑은 해당 논문에서 자사가 AI 모델 학습에 매니폴드 제약 하이퍼커넥션(mHC)을 사용하고 있다고 밝혔습니다.
임원은 개발자들이 대규모 언어 모델을 학습시킬 때 발생하는 문제들을 해결하기 위해 mHC를 사용할 것을 제안했습니다. 웬펑에 따르면, mHC는 다른 AI 개발자들이 대규모 언어 모델 학습에 사용하는 프레임워크인 하이퍼 커넥션(HC)의 업그레이드 버전입니다. 그는 HC를 비롯한 기존 AI 아키텍처는 모든 데이터를 하나의 좁은 채널을 통해서만 전달하도록 강제하는 반면, mHC는 그 경로를 여러 채널로 확장하여 학습 붕괴 없이 데이터와 정보의 원활한 전송을 가능하게 한다고 설명했습니다.
Omdia의 수석 분석가인 롄제수는 딥시크의 CEO인 원펑이 연구 결과를 공개한 것을 칭찬했습니다. 수는 딥시크가 학습 방법론을 공개하기로 한 결정은 중국 AI 산업에 대한 새로운 신뢰를 보여주는 것이라고 강조했습니다. 딥시크는 장악해 왔습니다. 마이크로소프트는 목요일에 발표한 보고서에서 딥시크가 중국 AI 시장의 89%를 점유하고 있으며 개발도상국에서도 성장세를 이어가고 있다고 밝혔습니다.

