Компания Alibaba открыла исходный код модели искусственного интеллекта для генерации видео и изображений

- Компания Alibaba открыла исходный код своей модели Wan 2.1 AI, сделав свою технологию генерации видео и изображений доступной для общественности, чтобы стимулировать инновации и конкуренцию.
- Компания выпускает четыре варианта Wan 2.1, использующих 14 миллиардов параметров для повышения точности и обработки сложных входных данных.
- Компания Alibaba планирует инвестировать 52 миллиарда долларов в искусственный интеллект и облачные вычисления, что станет одним из крупнейших проектов расширения инфраструктуры в этом секторе в Китае.
Компания Alibaba Group Holding Ltd. объявила о том, что ее модель искусственного интеллекта для генерации видео и изображений, Wan 2.1, теперь доступна в качестве платформы с открытым исходным кодом. Ожидается, что этот шаг будет способствовать внедрению и усилению конкуренции в сфере ИИ.
Alibaba соответствует аналогичной стратегии ByteDance и стартапа DeepSeek. Ранее в этом году доступные модели DeepSeek с открытым исходным кодом привлекли внимание технологических инвесторов и удивили капиталоемкую отрасль, показав производительность, сопоставимую с такими признанными игроками, как OpenAI.
Alibaba расширяет возможности в области искусственного интеллекта, предлагая четыре варианта WAN 2.1
Компания Alibaba выпустила четыре варианта своей модели Wan 2.1 AI — T2V-1.3B, T2V-14B, I2V-14B-720P и I2V-14B-480P, — которые генерируют изображения и видео на основе текстовых и графических входных данных. Обозначение «14B» указывает на то, что эти варианты обрабатывают 14 миллиардов параметров, что позволяет им обрабатывать более сложные входные данные и получать более точные результаты.
Эти модели доступны по всему миру на платформах ModelScope и HuggingFace от Alibaba Cloud для академического, исследовательского и коммерческого использования.
В январе Alibaba представила последнюю версию своей модели искусственного интеллекта для генерации видео и изображений, позже сократив ее название с Wanx до Wan. Компания подчеркнула ее способность генерировать высокореалистичные визуальные образы. С тех пор Alibaba подчеркивает свое лидирующее положение в VBench, рейтинге моделей генерации видео, где она превосходит конкурентов по таким функциям, как взаимодействие нескольких объектов.
Во вторник компания представила предварительную версию своей модели рассуждений QwQ-Max, которую она намерена сделать открытым исходным кодом после полного релиза.
Компания ByteDance запускает OmniHuman, систему искусственного интеллекта, которая создает видеоролики с изображением всего тела из одного снимка
Всплеск разработки ИИ с открытым исходным кодом происходит на фоне значительных успехов конкурентов. Компания ByteDance, материнская компания TikTok, недавно объявила о запуске OmniHuman, продвинутой системы ИИ, способной генерировать видео с изображением всего тела на основе всего одной фотографии.
Отличительной чертой OmniHuman от аналогичных систем искусственного интеллекта является способность создавать динамичные видеоролики, в которых субъект может говорить, жестикулировать и двигаться естественно. Система была обучена на более чем 19 000 часах видеоконтента и использует эти данные для создания видеороликов, имитирующих человеческое поведение с точки зрения движений и мимики.
Одна из первых демонстраций использования OmniHuman — это видео лекции Альберта Эйнштейна. Видео мгновенно стало вирусным в интернете, что доказывает, насколько важна эта функция.
Хотя OmniHuman — первая система искусственного интеллекта, которая утверждает, что может создать правдоподобное видео всего с одним изображением, другие системы могут добиться аналогичных результатов, используя всего несколько изображений.
Для начала, есть Pollo AI, который позволяет пользователям создавать видеоролики, загружая изображения. Он прост в использовании, и, имея всего лишь изображения и текстовую подсказку, может создавать видео на основе заданныхdefiстилей.
В Canva есть аналогичный генератор видео с использованием ИИ. Его набор шаблонов и функций редактирования позволяет пользователям без продвинутых навыков создания видео легко создавать видеоролики, сгенерированные ИИ, используя изображения.
У Freepik также есть похожий генератор видео на основе ИИ, который предлагает несколько режимов генерации и параметров настройки для создания увлекательных видеороликов, используя только изображения и подсказки.
Alibaba инвестирует 52 миллиарда долларов в развитие искусственного интеллекта и облачных технологий
Несколько дней назад Alibaba объявила о планах инвестировать не менее 380 миллиардов юаней (52 миллиарда долларов) в течение следующих трех лет для укрепления своей инфраструктуры облачных вычислений и искусственного интеллекта.
Интернет-гигант, соучредителем которого является Джек Ма, планирует инвестировать в свою инфраструктуру искусственного интеллекта и облачных вычислений больше, чем за последние 10 лет. В связи с тем, что развивающиеся модели становятся все более ресурсоемкими, компания заявила в своем официальном блоге, что Alibaba планирует выступать в качестве партнера для компаний, разрабатывающих и внедряющих ИИ в реальном мире.
Эта цель представляет собой одну из крупнейших инвестиций Китая в инфраструктуру искусственного интеллекта и подчеркивает растущие амбиции Alibaba в этой области. Однако она возникает на фоне опасений инвесторов по поводу того, не переоценят ли некоторые крупные технологические компании спрос на услуги ИИ в будущем или недооценят капитальные затраты на их создание.
Аналитики TD Cowen в пятницу отметили, что корпорация Microsoft расторгает договоры аренды значительной части мощностей центров обработки данных в США. Этот шаг может отражать опасения по поводу того, не создает ли компания больше вычислительных мощностей для искусственного интеллекта, чем ей потребуется в долгосрочной перспективе. Акции Alibaba на Гонконгской бирже упали в понедельник на 3%.
Другие крупные технологические компании, такие как Meta Platforms Inc. и Amazon.com Inc., обещают вложить миллиарды долларов в строительство центров обработки данных, необходимых для обучения, разработки и размещения сервисов искусственного интеллекта.
Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.
Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtronпровести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Неллиус Ирена
Неллиус — выпускница факультета управления бизнесом и информационных технологий с пятилетним опытом работы в криптовалютной индустрии. Она также является выпускницей Bitcoin Dada. Неллиус сотрудничала с ведущими СМИ, включая BanklessTimes, Cryptobasic и Riseup Media.
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)















