O Alibaba Group Holding Ltd. anunciou que seu modelo de IA em vídeo e imagem, Wan 2.1, agora está disponível ao público como uma plataforma de código aberto. Espera -se que a medida aumente a adoção e aumente a concorrência no espaço da IA.
do Alibaba está alinhada com uma estratégia semelhante pela Bytedance and Startup Deepseek. No início deste ano, os modelos de código aberto acessíveis da Deepseek chamaram a atenção dos investidores de tecnologia e surpreenderam a indústria intensiva de capital com desempenho comparável a players estabelecidos como o OpenAI.
Alibaba expande as ofertas de IA com quatro variantes WAN 2.1
O Alibaba lançou quatro variantes do seu modelo WAN 2.1 AI-T2V-1.3B, T2V-14B, I2V-14B-720P e I2V-14B-480P-que geram imagens e vídeos de entradas de texto e imagem. A designação "14b" significa que essas variantes processam 14 bilhões de parâmetros, permitindo lidar com entradas mais complexas e produzir resultados mais precisos.
Os modelos estão disponíveis globalmente nas plataformas ModelCope e Huggingface da Alibaba Cloud para uso acadêmico, de pesquisa e uso comercial.
O Alibaba introduziu a versão mais recente do modelo de IA de geração de vídeo e imagem em janeiro, depois reduzindo seu nome para Wan da WANX. A empresa elogiou sua capacidade de gerar visuais altamente realistas. Desde então, o Alibaba enfatizou sua classificação superior no VBEnch, uma tabela de classificação para modelos de geração de vídeo, onde se destaca em funcionalidades como a interação com vários objetos.
Na terça-feira, a empresa apresentou uma prévia de seu modelo de raciocínio, QWQ-MAX, que pretende fazer de código aberto após o lançamento total.
Bytedance lança Omnihuman, uma IA que cria vídeos de corpo inteiro de uma imagem
O aumento no desenvolvimento de IA de código aberto ocorre em meio a avanços significativos dos concorrentes. Bytedance, a empresa controladora da Tiktok, anunciou recentemente o lançamento do Omnihuman , um sistema de IA avançado que pode gerar um vídeo inteiro de corpo inteiro a partir da entrada de apenas uma fotografia.
O que diferencia o Omnihuman de sistemas de IA semelhantes é que ele pode criar vídeos dinâmicos nos quais o sujeito pode falar, gesto e se mover naturalmente. O sistema foi treinado em mais de 19.000 horas de conteúdo de vídeo e usa esses dados para criar vídeos que imitam o comportamento humano em termos de movimentos e expressões.
Uma das primeiras manifestações que usam Omnihuman é um vídeo de Albert Einstein entregando uma palestra. O vídeo se tornou viral no momento em que foi compartilhado na internet, que é a prova de quanta diferença esse recurso faz.
Embora o Omnihuman seja o primeiro sistema de IA a reivindicar a gerar um vídeo crível com apenas uma imagem, outros sistemas podem fornecer resultados semelhantes usando algumas imagens.
Para iniciantes, há Pollo AI, que permite que os usuários gerem vídeos enviando imagens. É fácil de usar e, com apenas imagens e um prompt de texto, ele pode criar vídeos com base nos estilosdefipelo usuário.
O Canva possui um gerador de vídeo AI semelhante. Seu conjunto de modelos e recursos de edição facilita para os usuários sem habilidades avançadas de criação de vídeo para criar vídeos gerados pela IA usando imagens.
A Freepik também possui um gerador de vídeo AI semelhante que oferece vários modos de geração e opções de personalização para criar vídeos envolventes com apenas imagens e prompts.
Alibaba comete US $ 52 bilhões para a IA e a expansão da nuvem
Alguns dias atrás, o Alibaba anunciou planos de investir pelo menos 380 bilhões de yuans (US $ 52 bilhões) nos próximos três anos para fortalecer sua computação em nuvem e infraestrutura de IA.
O gigante da Internet, cujo co-fundador é Jack Ma, investirá mais em sua inteligência artificial e infraestrutura de computação em nuvem do que nos últimos 10 anos. Com os modelos em evolução se tornando mais intensivos em computação, a empresa disse em seu blog oficial que o Alibaba planeja se destacar como parceiro de empresas que construíram e implantam IA no mundo real.
Esse objetivo é um dos maiores investimentos da China em infraestrutura de IA e ressalta as crescentes ambições do Alibaba no campo. Mas isso ocorre em meio a se preocupar com o investidor sobre se algumas grandes empresas de tecnologia superestimam a demanda por serviços de IA no futuro ou subestimam o custo de capital de construí -las.
Os analistas da TD Cowen apontaram na sexta -feira que a Microsoft Corp. está cancelando arrendamentos por capacidade substancial de data center nos EUA. Esse movimento pode refletir preocupações sobre se está construindo mais computação de IA do que precisará a longo prazo. Hong Kong, do Alibaba, compartilha, deslizou até 3% na segunda -feira.
Outras grandes empresas de tecnologia, como a Meta Platforms Inc. e a Amazon.com Inc., estão comprometendo bilhões a construir os data centers necessários para treinar, desenvolver e hospedar serviços de IA.
Principais diferenças : os projetos de criptografia de ferramenta secreta usam para obter cobertura de mídia garantida