DeepSeek의 새로운 모델이 AI 도약에서 플래그십 모델을 능가했습니다

에 의해

넬리우스 이레네

읽는 데 3분 소요 , 2025년 8월 21일

DeepSeek이 사고 효율성을 높인 새로운 V3.1 업데이트를 출시했습니다.
해당 스타트업의 새로운 업데이트는 여러 벤치마크에서 RI보다 우수한 성능을 보여줍니다.
시장 분석가들은 딥시크가 올해 초 R1의 후속 제품을 출시할 것으로 예상했었다.

중국 스타트업 딥시크(DeepSeek)는 새로운 업데이트를 발표하며, 주요 벤치마크에서 널리 알려진 R1보다 우수한 성능을 보인다고 주장했습니다. 딥시크는 목요일 위챗 게시물을 통해 새로운 모델 버전인 V3.1이 쿼리에 대한 응답 속도를 향상시켰으며, 이를 통해 인공지능 에이전트 개발에 본격적으로 뛰어들었음을 밝혔습니다.

DeepSeek은 또한 해당 모델이 사고 모드와 비사고 모드를 모두 갖춘 하이브리드 추론 아키텍처, 향상된 에이전트 기능, 그리고tron도구 사용 및 작업 실행에서 더욱 강력한 성능을 한다고 덧붙였습니다

DeepSeek은 모드 전환을 위한 "심층 사고" 버튼을 제공합니다

현재 DeepSeek의 공식 앱 과 웹사이트는 이미 3.1 버전으로 업데이트되어 사용자가 "심층 사고(Deep Thinking)" 버튼을 통해 사고 모드와 비사고 모드를 전환할 수 있게 되었습니다. 이는 Anthropic의 Opus 및 Sonnet과 같은 하이브리드 모델과 유사한 방식입니다.

보도에 따르면 V3.1 모델은 SWE, Terminal-Bench 등의 벤치마크와 사고 효율성에서 R1보다 우수한 성능을 보였습니다. 또한 Artificial Analysis에 따르면, 이 모델은 추론 모드에서 60점을 지능 지수 R1의 59점을 약간 웃돌았습니다. 하지만 기본 아키텍처는 총 6710억 개의 파라미터와 370억 개의 활성 파라미터를 사용하는 등 동일하게 유지되었습니다. 기록하여

효율성은 더 높지만, 추론 모드에서 사용하는 토큰 수는 R1보다 약간 적습니다. 그러나 새로운 모델은 성능 면에서 알리바바의 최신 모델 과 OpenAI의 오픈소스 추론 모델인 GPT-OSS에 비해 약간 뒤처집니다. 또한 추론 모드에서 함수 호출 기능이 없는데, 이는 에이전트 기반 워크플로우에서 중요한 제약 조건으로 여겨집니다.

해당 스타트업은 화요일에 새로운 모델을 처음 발표했지만, 당시에는 허깅페이스(Hugging Face)에서만 사용할 수 있었습니다. 별도의 성명에서 이 버전은 차세대 중국산 AI 칩에서 작동하도록 맞춤 제작되었다고 덧붙였습니다.

이번에 해당 회사는 업그레이드된 V3 버전에 대한 새로운 가격 정책을 발표했습니다. 이 정책은 일부 요금을 인상하고, 야간 할인을 없애고, 특정 애플리케이션의 비용을 인하하는 내용을 포함하며, 9월 6일부터 시행됩니다.

DeepSeek은 입력 API 가격을 캐시 적중 시 백만 토큰당 0.07달러, 캐시 미스 시 백만 토큰당 0.56달러로 책정했으며, 출력 토큰은 백만 토큰당 1.68달러로 책정했습니다. 이 가격은 경쟁사 제품보다 훨씬 저렴합니다. Gemini 2.5 Pro는 출력 토큰 백만 개당 10달러(프롬프트 시간이 길어질수록 15달러), OpenAI의 GPT-5도 10달러, Anthropic의 Claude Opus 4.1은 최대 75달러입니다.

분석가들은 DeepSeek이 올해 초 R1의 후속 버전을 출시할 것으로 예상했습니다

딥시크는 지난 1월 저렴하면서도 강력한 R1 AI 모델을 출시하며 실리콘 밸리에 큰 파장을 일으켰습니다. 이후 이 모델은 중국의 AI 산업 성장세에서 선두 자리를 지키며 오픈AI와 같은 미국 기업들을 위협하고 있습니다.

하지만 시장 관찰자들은 R1의 후속 모델인 R2 출시를 여전히 기다리고 있으며, 많은 사람들이 올해 초 출시될 것으로 예상했었습니다. 현지 보도에 따르면 출시 지연은 창업자인 량원펑이 모델을 완벽하게 다듬는 데 집중하고 있기 때문인 것으로 알려졌습니다. 그는 또한 수익성이 좋은 하이플라이어 자산운용 사업도 운영하고 있습니다.

Cryptopolitan 의 이전 보도와 같이 , 딥시크(DeepSeek)는 화웨이의 어센드(Ascend) 프로세서에서 지속적인 기술적 문제에 직면하여 R2 AI 모델 출시를 연기했습니다. 1월에 출시된 R1 모델의 성공 이후, 중국 당국은 딥시크에 미국산 엔비디아 제품 대신 화웨이 칩을 채택하도록 권장했습니다. 그러나 딥시크는 R2 모델 학습 단계에서 상당한 문제에 부딪혔습니다.

사정에 정통한 소식통에 따르면, 딥시크는 학습에는 엔비디아 칩을 사용하고 추론에는 화웨이의 어센드 프로세서를 사용해야 했다고 합니다. 업계 관계자들은 화웨이를 포함한 중국산 칩이 칩 간 연결성, 소프트웨어 지원, 전반적인 안정성 면에서 엔비디아에 비해 뒤처지는 경우가 많다고 지적합니다.

화웨이는 딥시크 사무실에 엔지니어들을 파견하여 모델 적용을 지원했습니다. 하지만 딥시크는 현장 지원에도 불구하고 어센드 하드웨어에서 학습 과정을 성공적으로 완료하지 못했습니다. 당초 5월 출시 예정이었던 R2 모델은 이러한 하드웨어 문제로 인해 출시가 연기되었습니다.

일부 중국 언론은 새로운 모델이 몇 주 안에 출시될 수 있다고 추측하는 반면, 딥시크의 창립자 량원펑은 개발 진행 상황에 대해 내부적으로 불만을 표명하며 회사의 경쟁력을 유지할 수 있는 모델을 개발하는 데 필요한 시간을 충분히 갖도록 팀에 촉구했습니다.

한편, 알리바바와 텐센트를 비롯한 업계 거물들은 꾸준히 업데이트를 발표하고 있으며, 특히 알리바바의 Qwen 모델은 강력한trontrac하고 있습니다.

이 글을 읽고 계시다면 이미 앞서 나가고 계신 겁니다. 뉴스레터를 구독하시면 더욱 유익한 정보를 받아보실 수 있습니다.

딥시크 제미니

이 기사를 공유하세요

면책 조항: 제공된 정보는 투자 조언이 아닙니다. Cryptopolitan이 페이지에 제공된 정보를 바탕으로 이루어진 투자에 대해 어떠한 책임도 지지 않습니다.tron권장합니다dent .

넬리우스 이레네

넬리우스는 경영학 및 IT 학사 학위를 소지하고 있으며 암호화폐 업계에서 5년의 경력을 쌓았습니다. 또한 비트코인 다다( Bitcoin Dada) 졸업생이기도 합니다. 넬리우스는 BanklessTimes, Cryptobasic, Riseup Media 등 주요 미디어 매체에 기고해 왔습니다.

1. DeepSeek은 모드 전환을 위한 "심층 사고" 버튼을 제공합니다

2. 분석가들은 DeepSeek이 올해 초 R1의 후속 버전을 출시할 것으로 예상했습니다

이 기사를 공유하세요