Alibaba Group Holding Ltd. объявила, что ее модель ИИ, сгенерирующая видео и изображение, WAN 2.1, теперь общедоступна в качестве платформы с открытым исходным кодом. Ожидается, что этот шаг увеличит принятие и усилит конкуренцию в пространстве ИИ.
Alibaba согласуется с аналогичной стратегией с помощью Bytedance и Startup DeepSeek. Ранее в этом году доступные модели Deepseek с открытым исходным кодом привлекли внимание со стороны технических инвесторов и удивили капиталоемкую индустрию, а производительность сравнилась с известными игроками, такими как Openai.
Alibaba расширяет предложения ИИ с четырьмя вариантами WAN 2.1
Alibaba выпустила четыре варианта своей модели WAN 2.1 AI-T2V-1.3B, T2V-14B, I2V-14B-720p и I2V-14B-480p-которые генерируют изображения и видео из вводов текста и изображений. Обозначение «14b» означает, что эти варианты обрабатывают 14 миллиардов параметров, что позволяет им обрабатывать более сложные входы и давать более точные результаты.
Модели доступны по всему миру на платформах Alibaba Cloud ModelsCope и Huggingface для академического, исследовательского и коммерческого использования.
Alibaba представила последнюю версию своей модели ИИ, генерирующей видео и изображения, а затем укорачивая свое название WAN от WANX. Компания рекламировала свою способность генерировать очень реалистичные визуальные эффекты. С тех пор Alibaba подчеркнула свой верхний рейтинг на Vbench, таблице лидеров для видео-генеративных моделей, где она превосходит функции, такие как многообъективное взаимодействие.
Во вторник компания представила предварительный просмотр своей модели рассуждений QWQ-MAX, который намерен сделать открытый источник при полном выпуске.
Bytedance запускает Omnihuman, ИИ, который создает видео всего тела из одного изображения
Вскоре в развитии ИИ с открытым исходным кодом возникает значительные достижения со стороны конкурентов. Bytedance, материнская компания Tiktok, недавно объявила о запуске Omnihuman , продвинутой системы ИИ, которая может генерировать целое видео всего тела с ввода только одной фотографии.
Что отличает Omnihuman от аналогичных систем искусственного интеллекта, так это то, что он может создавать динамические видео, в которых субъект может говорить, жест и двигаться естественным путем. Система была обучена более 19 000 часов видеоконтента и использует эти данные для создания видео, которые имитируют поведение человека с точки зрения движений и выражений.
Одной из первых демонстраций с использованием Omnihuman является видео, на котором Альберт Эйнштейн выступил с лекцией. Видео стало вирусным в тот момент, когда оно поделилось в Интернете, что является доказательством того, насколько разница эта функция.
В то время как Omnihuman является первой системой ИИ, которая утверждает, что генерирует правдоподобное видео только с одним изображением, другие системы могут дать аналогичные результаты, используя несколько изображений.
Для начала, есть Pollo AI, который позволяет пользователям генерировать видео, загружая изображения. Он прост в использовании, и с помощью только изображений и текстовой подсказки он может создавать видео на основе стилейdefi.
Canva имеет аналогичный видео генератор IA. Его набор шаблонов и функции редактирования позволяют пользователям легко без усовершенствованных навыков создания видео для создания видео, сгенерированных AI с использованием изображений.
Freepik также имеет аналогичный видеогенератор AI, который предлагает несколько режимов генерации и параметров настройки для создания привлекательных видео с изображениями и подсказками.
Alibaba приобретает 52 миллиарда долларов на расширение AI и облаков
Несколько дней назад Alibaba объявил о планах инвестировать не менее 380 миллиардов юаней (52 миллиарда долларов) в течение следующих трех лет, чтобы укрепить свои облачные вычисления и инфраструктуру ИИ.
Интернет-гигант, соучредителем которого является Джек Ма, будет инвестировать больше в свой искусственный интеллект и инфраструктуру облачных вычислений, чем в течение последних 10 лет. Поскольку развивающиеся модели становятся все более интенсивными, компания заявила в своем официальном блоге, что Alibaba планирует выступить в качестве партнера для компаний, создающих и развертывая ИИ в реальном мире.
Эта цель является одной из крупнейших в Китае инвестиций в инфраструктуру ИИ, и она подчеркивает растущие амбиции Алибабы в этой области. Но это происходит на фоне беспокойства инвесторов по поводу того, будут ли некоторые крупные технологические фирмы переоценивать спрос на услуги искусственного интеллекта в будущем или недооценивать капитальные затраты на их строительство.
Аналитики TD Cowen отметили в пятницу, что Microsoft Corp. отменяет аренду для значительной пропускной способности центра обработки данных в США. Этот шаг может отражать опасения по поводу того, строит ли он больше ИИ вычислений, чем в долгосрочной перспективе. Гонконгские акции Alibaba в понедельник сократились до 3%.
Другие крупные технологические фирмы, такие как Meta Platforms Inc. и Amazon.com Inc., обещают миллиарды для создания центров обработки данных, необходимых для обучения, разработки и размещения услуг ИИ.
Криптополитическая академия: скоро появится - новый способ заработать пассивный доход с DeFi в 2025 году. Узнайте больше