메이투안, 중국산 칩 데이터로 학습시킨 1조 6천억 개 매개변수의 LongCat-2.0 AI 모델 오픈소스 공개

에 의해

란다 모세스

2분 전 읽음 11초 전

메이투안이 중국산 칩 데이터로 학습시킨 1조 6천억 개의 매개변수를 가진 LongCat-2.0 AI 모델을 오픈소스로 공개했습니다.

메이투안은 중국산 칩으로 학습시킨 1조 6천억 개의 매개변수를 가진 오픈소스 AI 모델인 LongCat-2.0을 공개했습니다.
이번 발표는 중국 기업들이 서구의 제한적인 하드웨어에 의존하지 않고도 최첨단 규모의 모델을 개발할 수 있음을 입증합니다.
이는 수출 제한 조치가 중국 기술 부문의 하드웨어 자급자족을 장려하는 시점에 나온 것입니다.

메이투안은 1조 6천억 개의 매개변수를 가진 모델을 중국 국내 하드웨어로 학습시켰으며, 엔비디아 GPU는 전혀 사용하지 않았다고 주장합니다. 이 회사는 중국 최대의 지역 서비스 및 음식 배달 플랫폼입니다.

이번 발표는 미국의 수출 통제가 중국 기업들의 대규모 AI 구축 방식을 계속해서 변화시키고 있는 가운데 나왔습니다. 메이투안은 국내산 ASIC 슈퍼포드를 이용해 LongCat-2.0을 학습시켰습니다. 회사는 이 모델을 통해 중국 기업들이 엔비디아의 CUDA 기반 칩 없이도 최첨단 규모의 AI를 구현할 수 있다는 것을 입증했다고 주장합니다.

LongCat-2.0은 희소한 전문가 혼합 설계에서 실행됩니다

LongCat-2.0은 희소 혼합형 전문가 아키텍처를 사용합니다. DeepSeek과 Mistral의 Mixtral도 이와 유사한 접근 방식을 취합니다. 1조 6천억 개의 모든 매개변수를 동시에 적용하는 대신, 내부 라우터가 각 토큰에 특화된 하위 모델들의 부분집합을 선택합니다. 동일한 크기의 밀집형 모델과 비교했을 때, 이러한 설계는 추론 비용을 절감합니다.

해당 모델은 100만 토큰의 컨텍스트 윈도우를 제공합니다. DeepSeek-R1-0528과 OpenAI의 GPT-OSS는 모두 최대 토큰 값이 128,000입니다. 공개된 벤치마크에서 메이투안은 LongCat-2.0을 구글, OpenAI, 앤스로픽의 비공개 소스 모델과 비교했습니다. 그러나 현재까지 이러한 주장은 제3자의 객관적인 평가를 통해 검증되지 않았습니다.

메이투안은 AI 에이전트 및 코딩 도구의 주요 추론 엔진 역할을 하도록 LongCat-2.0을 개발했습니다. 회사는 코드 이해, 저장소 전체 편집 및 자동화된 작업 실행을 주요 사용 사례로 꼽았습니다.

번스타인은 엔비디아가 중국 AI 칩 시장의 40%를 점유하고 있다고 전망했다

증권 분석 회사인 번스타인은 2025년까지 엔비디아의 중국 인공지능 칩 시장 점유율을 약 40%로 예상했습니다. 화웨이도 비슷한 점유율을 보이고 있습니다. 번스타인은 올해 화웨이가 시장 점유율을 높여 엔비디아의 점유율이 8%포인트 하락할 것으로 예측했습니다.

국내 ASIC 클러스터와 관련하여 메이투안은 LongCat-2.0 모델을 학습 및 최적화했다고 주장합니다. 이는 해당 모델이 엔비디아의 소프트웨어 스택 없이도 중국에 이미 존재하는 하드웨어에서 실행될 수 있음을 의미합니다. 분산된 타사 구성이 아닌, "슈퍼포드"는 완벽하게 통합된 기업용 하드웨어를 의미합니다.

일반 소비자 기기나 대부분의 온프레미스 시스템은 LongCat-2.0의 1조 6천억 개의 파라미터를 처리할 수 없습니다. LongCat-2.0은 모델 병렬 처리를 사용하는 고밀도 추론 클러스터에 분산된 데이터 센터에 상주합니다.

메이투안의 주력 사업은 음식 배달이지, 첨단 AI 개발은 아니다. 베이징에 본사를 둔 이 회사는 2023년 AI 스타트업인 라이트이어비욘드를 2억 8100만 달러에 인수하며 AI 분야에 진출했다. 실리콘앵글에 따르면, 메이투안은 2025년까지 자체 모델 개발 계획을 공개적으로 발표하지 않았다.

또 다른 중국 AI 스타트업인 미니맥스(MiniMax)는 알리바바와 미호요(miHoYo)의 투자를 유치했습니다. 의 Cryptopolitan, 이 투자자들은 7월 9일 보호예수 기간 만료 전까지 주식을 매도하지 않기로 약속했습니다. 이전 보도 에 따르면

Cryptopolitan의 차이 리안 셰(Cai Lian She)에 따르면, 미니맥스(MiniMax)는 2026년 6월 초 자체 개발한 백만 토큰 컨텍스트 모델인 M3를 출시했습니다. 미니맥스는 미국 시장 선두 기업들보다 훨씬 낮은 가격을 제시했습니다.

dent 테스트를 통해 중국 외 개발자들이 LongCat-2.0을 얼마나 진지하게 받아들일지가 결정될 것입니다. 국내 칩에 대한 최적화는 전 세계 데이터 센터를 여전히 장악하고 있는 엔비디아 하드웨어에서의 성능을 제한할 수 있습니다. 메이투안에 따르면 핵심 추론 아키텍처는 이식성이 뛰어납니다.

암호화폐 뉴스를 단순히 읽는 데 그치지 마세요. 이해하세요. 저희 뉴스레터를 구독하세요. 무료입니다.

자주 묻는 질문

LongCat-2.0이란 무엇인가요?

LongCat-2.0은 메이투안에서 개발한 1조 6천억 개의 매개변수를 가진 오픈 소스 대규모 언어 모델로, 희소 혼합 전문가 아키텍처를 사용하며 100만 토큰 규모의 컨텍스트 창을 제공합니다.

국내 칩 트레이닝이 왜 중요한가요?

메이투안은 롱캣-2.0을 전적으로 중국산 ASIC 클러스터에서 학습시켰다고 밝히며, 엔비디아 GPU 없이도 최첨단 규모의 AI 모델을 구축할 수 있음을 입증했다고 전했다.

LongCat-2.0은 다른 AI 모델과 비교했을 때 어떤 차이가 있나요?

메이투안이 공개한 벤치마크 결과에 따르면 해당 모델은 구글, 오픈AI, 앤스로픽의 비공개 소스 모델과 비슷한 수준이지만,dent 인 검증은 아직 진행 중입니다.

이 기사를 공유하세요

란다 모세스

란다 모세스는 Cryptopolitan 의 편집자 겸 기자로, 기술, 인공지능, 로봇공학, 암호화폐, 사기 및 해킹 관련 기사를 쓰고 있습니다. 2017년부터 암호화폐 업계에서 활동해 온 그녀는 포워드 프로토콜, 아마직스, 크립토솜니악에서 근무한 경력이 있습니다. 란다는 브래드퍼드 대학교에서 전기tron공학 학위를 받았습니다.