Alibaba disponibiliza em código aberto modelo de IA para geração de vídeo e imagem

Por

Nélio Irene

Tempo de leitura: 3 minutos - 26 de fevereiro de 2025

Alibaba disponibiliza em código aberto modelo de IA para geração de vídeo e imagem

A Alibaba torna público o código-fonte do seu modelo de IA Wan 2.1, disponibilizando sua tecnologia de geração de vídeo e imagem para impulsionar a inovação e a concorrência.
A empresa lança quatro variantes do Wan 2.1, que utilizam 14 bilhões de parâmetros para aumentar a precisão e lidar com entradas complexas.
A Alibaba planeja um investimento de US$ 52 bilhões em IA e computação em nuvem, marcando uma das maiores expansões de infraestrutura da China no setor.

O Alibaba Group Holding Ltd. anunciou que seu modelo de IA para geração de vídeos e imagens, Wan 2.1, agora está disponível publicamente como uma plataforma de código aberto. Espera-se que essa iniciativa impulsione a adoção e acirre a competição no setor de IA.

da Alibaba está alinhada com uma estratégia semelhante da ByteDance e da startup DeepSeek. No início deste ano, os modelos de código aberto acessíveis da DeepSeek atraíram a atenção de investidores de tecnologia e surpreenderam o setor, que exige grande investimento de capital, com um desempenho comparável ao de empresas consolidadas como a OpenAI.

Alibaba expande oferta de IA com quatro variantes de Wan 2.1

A Alibaba lançou quatro variantes do seu modelo de IA Wan 2.1 — T2V-1.3B, T2V-14B, I2V-14B-720P e I2V-14B-480P — que geram imagens e vídeos a partir de entradas de texto e imagem. A designação "14B" significa que essas variantes processam 14 bilhões de parâmetros, permitindo-lhes lidar com entradas mais complexas e produzir resultados mais precisos.

Os modelos estão disponíveis globalmente nas plataformas ModelScope e HuggingFace da Alibaba Cloud para uso acadêmico, de pesquisa e comercial.

Em janeiro, a Alibaba apresentou a versão mais recente de seu modelo de IA para geração de vídeos e imagens, posteriormente abreviando seu nome de Wanx para Wan. A empresa destacou sua capacidade de gerar visuais altamente realistas. Desde então, a Alibaba tem enfatizado sua posição de destaque no VBench, um ranking de modelos generativos de vídeo, onde se sobressai em funcionalidades como interação com múltiplos objetos.

Na terça-feira, a empresa revelou uma prévia de seu modelo de raciocínio, o QwQ-Max, que pretende tornar de código aberto após o lançamento completo.

A ByteDance lança o OmniHuman, uma IA que cria vídeos de corpo inteiro a partir de uma única imagem

O aumento no desenvolvimento de IA de código aberto ocorre em meio a avanços significativos de concorrentes. A ByteDance, empresa controladora do TikTok, anunciou recentemente o lançamento do OmniHuman, um sistema avançado de IA capaz de gerar um vídeo completo de corpo inteiro a partir de uma única fotografia.

O que diferencia o OmniHuman de sistemas de IA semelhantes é a sua capacidade de criar vídeos dinâmicos nos quais o sujeito pode falar, gesticular e se mover naturalmente. O sistema foi treinado com mais de 19.000 horas de conteúdo em vídeo e utiliza esses dados para criar vídeos que imitam o comportamento humano em termos de movimentos e expressões.

Uma das primeiras demonstrações usando o OmniHuman é um vídeo de Albert Einstein dando uma palestra. O vídeo viralizou no momento em que foi compartilhado na internet, o que comprova a enorme diferença que esse recurso faz.

Embora o OmniHuman seja o primeiro sistema de IA a afirmar gerar um vídeo convincente com apenas uma imagem, outros sistemas podem apresentar resultados semelhantes usando poucas imagens.

Para começar, existe o Pollo AI, que permite aos usuários gerar vídeos enviando imagens. É fácil de usar e, com apenas imagens e um texto de apresentação, pode criar vídeos com base em estilosdefipelo usuário.

O Canva possui um gerador de vídeos com IA semelhante. Seu conjunto de modelos e recursos de edição facilita a criação de vídeos gerados por IA a partir de imagens, mesmo para usuários sem habilidades avançadas em criação de vídeos.

O Freepik também possui um gerador de vídeos com IA semelhante, que oferece diversos modos de geração e opções de personalização para criar vídeos envolventes usando apenas imagens e instruções.

Alibaba investe US$ 52 bilhões em expansão de IA e nuvem

Há alguns dias, o Alibaba anunciou planos para investir pelo menos 380 bilhões de yuans (US$ 52 bilhões) nos próximos três anos para fortalecer sua infraestrutura de computação em nuvem e inteligência artificial.

A gigante da internet, cujo cofundador é Jack Ma, investirá mais em sua infraestrutura de inteligência artificial e computação em nuvem do que nos últimos 10 anos. Com a evolução dos modelos que exigem cada vez mais poder computacional, a empresa afirmou em seu blog oficial que o Alibaba planeja se destacar como parceiro de empresas que desenvolvem e implementam IA no mundo real.

Este objetivo representa um dos maiores investimentos da China em infraestrutura de IA e ressalta as crescentes ambições do Alibaba nessa área. No entanto, surge em meio a preocupações de investidores sobre se algumas grandes empresas de tecnologia superestimarão a demanda por serviços de IA no futuro ou subestimarão o custo de capital para desenvolvê-los.

Analistas da TD Cowen apontaram na sexta-feira que a Microsoft Corp. está cancelando contratos de locação de uma quantidade substancial de capacidade de data center nos EUA. Essa medida pode refletir preocupações sobre se a empresa está construindo mais capacidade de computação de IA do que precisará a longo prazo. As ações da Alibaba em Hong Kong caíram até 3% na segunda-feira.

Outras grandes empresas de tecnologia, como a Meta Platforms Inc. e a Amazon.com Inc., estão prometendo bilhões para construir os centros de dados necessários para treinar, desenvolver e hospedar serviços de IA.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Alibaba ByteDance CNY DeepSeek

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Nélio Irene

Nellius é formada em Administração de Empresas e TI, com cinco anos de experiência no setor de criptomoedas. Ela também é graduada pela Bitcoin Dada. Nellius já contribuiu para importantes publicações de mídia, incluindo BanklessTimes, Cryptobasic e Riseup Media.

ÍNDICE

1. Alibaba expande oferta de IA com quatro variantes de Wan 2.1

2. A ByteDance lança o OmniHuman, uma IA que cria vídeos de corpo inteiro a partir de uma única imagem

3. Alibaba investe US$ 52 bilhões em expansão de IA e nuvem

Compartilhe este artigo