A Alibaba lançou um novo modelo de IA como parte da série Quen. A gigante da tecnologia afirma que esse modelo é capaz de processar vídeo, áudio, imagens e texto. Ele também é eficiente o suficiente para funcionar diretamente em laptops e celulares.
A empresa mencionou que o novo modelo, disponível no GitHub e no Hugging Face, pode ser utilizado em agentes de IA. Esses agentes de IA ajudarão pessoas com deficiência visual a se locomoverem em seus arredores com a ajuda de audiodescrição em tempo real.
A Alibaba tem sido bastante ágil com seus novos lançamentos. Aparentemente, a gigante da tecnologia está investindo pesado em inteligência artificial em 2025. Apenas alguns dias após o lançamento do DeepSeek, a empresa de e-commerce lançou uma nova versão do seu modelo Quen. No início de março, também lançou uma versão mais recente do Quart, seu aplicativo de assistente de IA.
A Alibaba não é a única empresa trabalhando com IA multimodal. Concorrentes como a OpenAI e o Google, da Alphabet Inc., também lançaram ferramentas de IA generativa capazes de lidar com diferentes tipos de entrada, como texto e áudio. Na terça-feira, a OpenAI adicionou recursos avançados de geração de imagens ao ChatGPT, expandindo ainda mais suas capacidades.
A empresa afirmou que planeja investir mais em sua rede de IA e computação em nuvem do que na última década. O Alibaba almeja se tornar um parceiro fundamental para empresas que desenvolvem e aplicam IA em contextos práticos, à medida que os modelos se tornam mais avançados e exigem maior poder computacional.
Enquanto isso, os serviços de IA de baixo custo da China estão desafiando as ofertas mais caras das principais empresas americanas, pressionando seus modelos de negócios. No entanto, nem todos ainda estão convencidos de que esses lançamentos de IA superam ou se igualam à tecnologia de ponta ocidental.

