알리바바, 영상 및 이미지 생성 AI 모델 오픈소스 공개

에 의해

넬리우스 이레네

읽는 데 3분 소요 , 2025년 2월 26일

알리바바는 자사의 완 2.1 AI 모델을 오픈소스로 공개하여, 영상 및 이미지 생성 기술을 일반에 제공함으로써 혁신과 경쟁을 촉진하고자 합니다.
이 회사는 정확도를 높이고 복잡한 입력을 처리하기 위해 140억 개의 매개변수를 활용하는 WAN 2.1 변형 제품 4종을 출시했습니다.
알리바바는 인공지능 및 클라우드 컴퓨팅 분야에 520억 달러를 투자할 계획이며, 이는 중국이 해당 분야에서 진행하는 최대 규모의 인프라 확장 중 하나가 될 것이다.

알리바바 그룹 홀딩스는 자사의 영상 및 이미지 생성 AI 모델인 완(Wan) 2.1을 오픈 소스 플랫폼으로 공개했다고 발표했습니다. 이번 발표는 AI 분야의 도입을 촉진하고 경쟁을 심화시킬 것으로 예상됩니다.

알리바바의 이번 결정은 바이트댄스와 스타트업 딥시크의 유사한 전략과 맥을 같이합니다. 올해 초, 딥시크의 저렴한 오픈소스 모델은 기술 투자자들의 주목을 받았으며, 자본 집약적인 업계에서 오픈AI와 같은 기존 업체들과 견줄 만한 성능을 보여주며 놀라움을 안겨주었습니다.

알리바바, 4가지 WAN 2.1 변형 모델로 AI 제품군 확장

알리바바는 텍스트와 이미지 입력을 기반으로 이미지와 비디오를 생성하는 AI 모델인 완(Wan) 2.1의 네 가지 변형 버전(T2V-1.3B, T2V-14B, I2V-14B-720P, I2V-14B-480P)을 출시했습니다. "14B"는 이 변형 버전들이 140억 개의 매개변수를 처리하여 더욱 복잡한 입력을 처리하고 더 정확한 결과를 생성할 수 있음을 의미합니다.

해당 모델들은 알리바바 클라우드의 ModelScope 및 HuggingFace 플랫폼에서 전 세계적으로 학술, 연구 및 상업적 용도로 이용 가능합니다.

알리바바는 지난 1월 동영상 및 이미지 생성 AI 모델의 최신 버전을 공개하고, 이후 모델명을 Wanx에서 Wan으로 줄였습니다. 회사는 이 모델이 매우 사실적인 영상을 생성할 수 있다고 강조했습니다. 알리바바는 이후 동영상 생성 모델 순위표인 VBench에서 최상위권을 차지하고 있으며, 특히 다중 객체 상호작용과 같은 기능에서 뛰어난 성능을 보여준다는 점을 강조해 왔습니다.

화요일에 해당 회사는 자체 추론 모델인 QwQ-Max의 미리보기 버전을 공개했으며, 정식 출시 후 오픈 소스로 공개할 예정입니다.

바이트댄스는 한 장의 사진으로 전신 영상을 생성하는 AI인 옴니휴먼(OmniHuman)을 출시했습니다

오픈소스 AI 개발의 급증은 경쟁사들의 상당한 발전 속에서 나타나고 있습니다. 바이트댄스는 틱톡의 모회사인 최근 을 단 한 장의 사진 입력만으로 전신 영상을 생성할 수 있는 고급 AI 시스템 인 옴니휴먼(OmniHuman) 출시한다고 발표했습니다

옴니휴먼이 유사한 AI 시스템과 차별화되는 점은 피사체가 자연스럽게 말하고, 손짓하고, 움직이는 역동적인 영상을 제작할 수 있다는 것입니다. 이 시스템은 19,000시간 이상의 영상 콘텐츠를 학습하여 인간의 움직임과 표정을 모방한 영상을 만들어냅니다.

옴니휴먼을 활용한 최초의 시연 중 하나는 알베르트 아인슈타인의 강연 영상입니다. 이 영상은 인터넷에 공유되자마자 폭발적인 인기를 얻었는데, 이는 이 기능이 얼마나 큰 차이를 만들어내는지를 보여주는 증거입니다.

옴니휴먼은 단 한 장의 이미지로 실감나는 영상을 생성할 수 있다고 주장하는 최초의 AI 시스템이지만, 다른 시스템들도 몇 장의 이미지를 사용하여 유사한 결과를 제공할 수 있습니다.

우선, Pollo AI라는 앱이 있는데, 이 앱은 사용자가 이미지를 업로드하여 동영상을 생성할 수 있게 해줍니다. 사용법도 간단하고, 이미지와 텍스트 입력만으로 사용자가defi스타일에 맞춰 동영상을 만들 수 있습니다.

Canva에도 비슷한 AI 비디오 생성기가 있습니다. 다양한 템플릿과 편집 기능을 통해 고급 비디오 제작 기술이 없는 사용자도 이미지를 사용하여 AI 생성 비디오를 쉽게 만들 수 있습니다.

Freepik에도 이미지와 간단한 설명만으로 매력적인 영상을 제작할 수 있는 다양한 생성 모드와 맞춤 설정 옵션을 제공하는 유사한 AI 비디오 생성기가 있습니다.

알리바바, AI 및 클라우드 확장에 520억 달러 투자

며칠 전 알리바바는 향후 3년간 클라우드 컴퓨팅 및 인공지능(AI) 인프라 강화를 위해 최소 3800억 위안 (520억 달러)을 투자할 계획이라고 발표했습니다

공동 창업자 잭 마가 이끄는 인터넷 거대 기업 알리바바는 지난 10년 동안보다 더 많은 금액을 인공지능(AI) 및 클라우드 컴퓨팅 인프라에 투자할 예정입니다. 알리바바는 공식 블로그를 통해 진화하는 모델들이 점점 더 많은 연산 능력을 요구함에 따라, 실세계에서 AI를 개발하고 배포하는 기업들의 든든한 파트너가 되고자 한다고 밝혔습니다.

이번 투자는 중국의 인공지능(AI) 인프라 투자 중 최대 규모 중 하나이며, 알리바바의 AI 분야에 대한 야심이 커지고 있음을 보여줍니다. 하지만 일부 대형 기술 기업들이 미래 AI 서비스 수요를 과대평가하거나 구축 비용을 과소평가할 것이라는 투자자들의 우려가 제기되는 가운데 나온 것입니다.

TD Cowen 애널리스트들은 금요일 마이크로소프트가 미국 내 상당 규모의 데이터센터 임대 계약을 해지하고 있다고 지적했습니다 . 이러한 움직임은 마이크로소프트가 장기적으로 필요 이상으로 인공지능(AI) 컴퓨팅 시설을 구축하고 있는 것은 아닌지에 대한 우려를 반영하는 것일 수 있습니다. 알리바바의 홍콩 주가는 월요일 최대 3% 하락했습니다.

메타 플랫폼(Meta Platforms Inc.)과 아마존(Amazon.com Inc.)과 같은 다른 대형 기술 기업들도 AI 서비스를 학습, 개발 및 호스팅하는 데 필요한 데이터 센터를 구축하기 위해 수십억 달러를 투자하겠다고 약속하고 있습니다.

이 글을 읽고 계시다면 이미 앞서 나가고 계신 겁니다. 뉴스레터를 구독하시면 더욱 유익한 정보를 받아보실 수 있습니다.

알리바바 바이트댄스 CNY 딥시크

이 기사를 공유하세요

면책 조항: 제공된 정보는 투자 조언이 아닙니다. Cryptopolitan이 페이지에 제공된 정보를 바탕으로 이루어진 투자에 대해 어떠한 책임도 지지 않습니다.tron권장합니다dent .

넬리우스 이레네

넬리우스는 경영학 및 IT 학사 학위를 소지하고 있으며 암호화폐 업계에서 5년의 경력을 쌓았습니다. 또한 비트코인 다다( Bitcoin Dada) 졸업생이기도 합니다. 넬리우스는 BanklessTimes, Cryptobasic, Riseup Media 등 주요 미디어 매체에 기고해 왔습니다.

1. 알리바바, 4가지 WAN 2.1 변형 모델로 AI 제품군 확장

2. 바이트댄스는 한 장의 사진으로 전신 영상을 생성하는 AI인 옴니휴먼(OmniHuman)을 출시했습니다

3. 알리바바, AI 및 클라우드 확장에 520억 달러 투자

이 기사를 공유하세요