중국의 한 인공지능 기업이 자사의 주요 챗봇에 이미지 및 비디오 인식 기능을 추가했습니다.
동시에 국내 반도체 제조업체들은 과거 미국 업체들의 강점이었던 신속한 제품 출시 지원 능력을 이제는 따라잡을 수 있음을 보여주었다.
항저우에 본사를 둔 딥시크(DeepSeek)는 자사 채팅 플랫폼에 "이미지 인식 모드"라는 새로운 기능을 조용히 추가했습니다. 이 새로운 모드는 이달 초에 출시된 "전문가 모드"와 "플래시 모드"에 이어 세 번째로 추가된 기능입니다
새로운 기능 덕분에 챗봇은 텍스트뿐만 아니라 사진과 동영상도 이해할 수 있게 되었습니다.
이로써 해당 기능은 이미 오래전부터 유사한 기능을 제공해 온 다른 주요 AI 챗봇들과 어깨를 나란히 하게 되었습니다.
딥시크의 멀티모달 팀을 이끄는 천샤오캉은 해당 도구가 웹사이트와 모바일 앱 모두에서 소수의 사용자를 대상으로 먼저 테스트되었다고 밝혔습니다.
이 회사 선임 연구원인 첸 델리는 짧은 게시물로 출시를 축하했습니다 회사 로고를 언급하며 "작은 고래가 이제 볼 수 있게 됐어요"라는
지 불과 며칠 만에 출시되었습니다 딥시크가 최신 플래그십 모델인 딥시크-V4의 미리보기를 공개하고 모델 가중치를 누구나 다운로드하여 사용할 수 있도록 제공한
V4는 하나의 모델이 아니라 두 가지 모델입니다. 첫 번째 모델인 DeepSeek-V4-Pro는 1조 6천억 개의 파라미터를 가지고 있으며, 복잡한 추론과 여러 단계를 거치는 자동화된 워크플로우가 필요한 어려운 작업을 위해 설계되었습니다.
두 번째 모델인 DeepSeek-V4-Flash는 더 낮은 비용으로 많은 수의 요청을 처리하도록 설계되었습니다. 구성된 컨텍스트 윈도우를 지원합니다 백만 개의 토큰으로
또한, 회사 측에 따르면 추론 과정에서 필요한 컴퓨팅 성능과 메모리를 줄여주는 하이브리드 어텐션 설계를 사용합니다.
중국 반도체 제조업체들이 새로운 이정표를 세웠습니다
많은 업계 관계자들의 관심을 끈 것은 모델 자체뿐만 아니라 출시 당일에 일어난 일이었다.
화웨이 어센드, 캠브리콘, 하이곤 인포메이션, 무어 스레드 등 중국의 4개 칩 제조업체는 모두 자사 하드웨어가 V4 출시 첫날부터 완벽하게 작동했다고 확인했습니다.
새로운 모델이 출시 직후 몇 주 또는 몇 달 후가 아닌 비NVIDIA 칩에서도 원활하게 작동하는 이러한 당일 지원은 이전에는 Nvidia 자체 생태계 외부에서는 거의 불가능했습니다.
화웨이의 Ascend 칩(A2, A3, 950 포함)은 V4-Pro와 V4-Flash를 모두 지원합니다.
회사 측은 자사의 Ascend 950 칩이 융합 컴퓨팅 프로세스와 병렬 처리 스트림을 사용하여 추론 속도를 높인다고 밝혔습니다.
Cambricon은 오픈 소스 vLLM 추론 프레임워크를 사용하여 자체 적용을 완료하고 해당 코드를 GitHub에 공유했습니다.
하이곤은 자사의 DCU 플랫폼에서 심층적인 모델 최적화를 수행하여 모델 출시부터 실제 사용까지 원활한 경로를 구축했다고 밝혔습니다.
Moore Threads는 베이징 인공지능 연구원과 협력하여 FlagOS 소프트웨어 스택을 사용하여 MTT S5000 카드에서 V4를 실행했습니다.
업계 전문가들은 이번 동시다발적 출시가 진정한 변화를 의미한다고 평가합니다.
수년간 엔비디아 생태계 외부에서 제조된 칩이 주요 신형 모델을 지원하는 데에는 몇 달이 걸리곤 했습니다. 이번에 8개의 서로 다른 국내 칩셋이 출시 당일부터 작동하도록 만든 것은 상당한 이정표입니다.
더 큰 그림: 딥시크의 비용 및 독립성
관찰자들은 이번 출시의 더 큰 의미는 딥시크가 서구 하드웨어에 의존하지 않고도 고수준의 AI를 구현할 수 있음을 입증했다는 점이라고 보고 있습니다.
자사 모델이 여러 중국산 칩에서 동시에 네이티브로 작동하도록 함으로써, 중국 기업들이 가장 강력한 미국산 프로세서에 접근하는 것을 막아온 수출 제한으로 인한 위험을 줄였습니다.
비용 또한 중요한 요소입니다. DeepSeek은 모델 실행 비용을 낮추기 위해 많은 노력을 기울여 왔습니다 . 덕분에 기업들은 높은 컴퓨팅 비용 부담 없이 자동화 시스템을 구축할 수 있습니다.
이처럼 딥시크의 업그레이드와 출시는 단순히 하나의 기술적 돌파구에 관한 것이 아닙니다. 오히려 전체 공급망이 하나로 통합되는 것에 더 가깝습니다.
이번 발표를 계기로 인공지능 분야의 주도권은 누가 가장 똑똑한 모델을 만드는가에서 누가 전체 시스템을 저렴하고dent으로 장기적으로 운영할 수 있는가로 옮겨가는 듯하다.

