최신 뉴스
당신을 위해 엄선되었습니다
주간
최고 자리를 유지하세요

최고의 암호화폐 관련 정보를 이메일로 받아보세요.

메이투안, 중국산 칩 데이터로 학습시킨 1조 6천억 개 매개변수의 LongCat-2.0 AI 모델 오픈소스 공개

에 의해란다 모세스란다 모세스
2분 전 읽음
메이투안이 중국산 칩 데이터로 학습시킨 1조 6천억 개의 매개변수를 가진 LongCat-2.0 AI 모델을 오픈소스로 공개했습니다.
  • 메이투안은 중국산 칩으로 학습시킨 1조 6천억 개의 매개변수를 가진 오픈소스 AI 모델인 LongCat-2.0을 공개했습니다.
  • 이번 발표는 중국 기업들이 서구의 제한적인 하드웨어에 의존하지 않고도 최첨단 규모의 모델을 개발할 수 있음을 입증합니다.
  • 이는 수출 제한 조치가 중국 기술 부문의 하드웨어 자급자족을 장려하는 시점에 나온 것입니다.

메이투안은 1조 6천억 개의 매개변수를 가진 모델을 중국 국내 하드웨어로 학습시켰으며, 엔비디아 GPU는 전혀 사용하지 않았다고 주장합니다. 이 회사는 중국 최대의 지역 서비스 및 음식 배달 플랫폼입니다.

이번 발표는 미국의 수출 통제가 중국 기업들의 대규모 AI 구축 방식을 계속해서 변화시키고 있는 가운데 나왔습니다. 메이투안은 국내산 ASIC 슈퍼포드를 이용해 LongCat-2.0을 학습시켰습니다. 회사는 이 모델을 통해 중국 기업들이 엔비디아의 CUDA 기반 칩 없이도 최첨단 규모의 AI를 구현할 수 있다는 것을 입증했다고 주장합니다.

LongCat-2.0은 희소한 전문가 혼합 설계에서 실행됩니다

LongCat-2.0은 희소 혼합형 전문가 아키텍처를 사용합니다. DeepSeek과 Mistral의 Mixtral도 이와 유사한 접근 방식을 취합니다. 1조 6천억 개의 모든 매개변수를 동시에 적용하는 대신, 내부 라우터가 각 토큰에 특화된 하위 모델들의 부분집합을 선택합니다. 동일한 크기의 밀집형 모델과 비교했을 때, 이러한 설계는 추론 비용을 절감합니다.

해당 모델은 100만 토큰의 컨텍스트 윈도우를 제공합니다. DeepSeek-R1-0528과 OpenAI의 GPT-OSS는 모두 최대 토큰 값이 128,000입니다. 공개된 벤치마크에서 메이투안은 LongCat-2.0을 구글, OpenAI, 앤스로픽의 비공개 소스 모델과 비교했습니다. 그러나 현재까지 이러한 주장은 제3자의 객관적인 평가를 통해 검증되지 않았습니다.

메이투안은 AI 에이전트 및 코딩 도구의 주요 추론 엔진 역할을 하도록 LongCat-2.0을 개발했습니다. 회사는 코드 이해, 저장소 전체 편집 및 자동화된 작업 실행을 주요 사용 사례로 꼽았습니다.

번스타인은 엔비디아가 중국 AI 칩 시장의 40%를 점유하고 있다고 전망했다

증권 분석 회사인 번스타인은 2025년까지 엔비디아의 중국 인공지능 칩 시장 점유율을 약 40%로 예상했습니다. 화웨이도 비슷한 점유율을 보이고 있습니다. 번스타인은 올해 화웨이가 시장 점유율을 높여 엔비디아의 점유율이 8%포인트 하락할 것으로 예측했습니다.

국내 ASIC 클러스터와 관련하여 메이투안은 LongCat-2.0 모델을 학습 및 최적화했다고 주장합니다. 이는 해당 모델이 엔비디아의 소프트웨어 스택 없이도 중국에 이미 존재하는 하드웨어에서 실행될 수 있음을 의미합니다. 분산된 타사 구성이 아닌, "슈퍼포드"는 완벽하게 통합된 기업용 하드웨어를 의미합니다.

일반 소비자 기기나 대부분의 온프레미스 시스템은 LongCat-2.0의 1조 6천억 개의 파라미터를 처리할 수 없습니다. LongCat-2.0은 모델 병렬 처리를 사용하는 고밀도 추론 클러스터에 분산된 데이터 센터에 상주합니다.

메이투안의 주력 사업은 음식 배달이지, 첨단 AI 개발은 아니다. 베이징에 본사를 둔 이 회사는 2023년 AI 스타트업인 라이트이어비욘드를 2억 8100만 달러에 인수하며 AI 분야에 진출했다. 실리콘앵글에 따르면, 메이투안은 2025년까지 자체 모델 개발 계획을 공개적으로 발표하지 않았다.

또 다른 중국 AI 스타트업인 미니맥스(MiniMax)는 알리바바와 미호요(miHoYo)의 투자를 유치했습니다. 의 Cryptopolitan, 이 투자자들은 7월 9일 보호예수 기간 만료 전까지 주식을 매도하지 않기로 약속했습니다. 이전 보도 에 따르면

Cryptopolitan의 차이 리안 셰(Cai Lian She)에 따르면, 미니맥스(MiniMax)는 2026년 6월 초 자체 개발한 백만 토큰 컨텍스트 모델인 M3를 출시했습니다. 미니맥스는 미국 시장 선두 기업들보다 훨씬 낮은 가격을 제시했습니다.

dent 테스트를 통해 중국 외 개발자들이 LongCat-2.0을 얼마나 진지하게 받아들일지가 결정될 것입니다. 국내 칩에 대한 최적화는 전 세계 데이터 센터를 여전히 장악하고 있는 엔비디아 하드웨어에서의 성능을 제한할 수 있습니다. 메이투안에 따르면 핵심 추론 아키텍처는 이식성이 뛰어납니다.

암호화폐 뉴스를 단순히 읽는 데 그치지 마세요. 이해하세요. 저희 뉴스레터를 구독하세요. 무료입니다.

자주 묻는 질문

LongCat-2.0이란 무엇인가요?

LongCat-2.0은 메이투안에서 개발한 1조 6천억 개의 매개변수를 가진 오픈 소스 대규모 언어 모델로, 희소 혼합 전문가 아키텍처를 사용하며 100만 토큰 규모의 컨텍스트 창을 제공합니다.

국내 칩 트레이닝이 왜 중요한가요?

메이투안은 롱캣-2.0을 전적으로 중국산 ASIC 클러스터에서 학습시켰다고 밝히며, 엔비디아 GPU 없이도 최첨단 규모의 AI 모델을 구축할 수 있음을 입증했다고 전했다.

LongCat-2.0은 다른 AI 모델과 비교했을 때 어떤 차이가 있나요?

메이투안이 공개한 벤치마크 결과에 따르면 해당 모델은 구글, 오픈AI, 앤스로픽의 비공개 소스 모델과 비슷한 수준이지만,dent 인 검증은 아직 진행 중입니다.

이 기사를 공유하세요
란다 모세스

란다 모세스

란다 모세스는 Cryptopolitan 의 편집자 겸 기자로, 기술, 인공지능, 로봇공학, 암호화폐, 사기 및 해킹 관련 기사를 쓰고 있습니다. 2017년부터 암호화폐 업계에서 활동해 온 그녀는 포워드 프로토콜, 아마직스, 크립토솜니악에서 근무한 경력이 있습니다. 란다는 브래드퍼드 대학교에서 전기tron공학 학위를 받았습니다.

더 많은 뉴스
심층 암호
화폐 속성 강좌